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Verfahren zur Transformation von pflanzlichen Plastiden 
Beschreibung 

5 

Die vorliegende Erfindung betrifft neue Verfahren zur Herstellung 
transgener Pflanzen mit gentechnisch veranderten Plastiden, sowie 
die mit diesen Verfahren hergestellten transgenen Pflanzen. 

10 Ziel biotechnologischer Arbeiten an Pflanzen ist die Herstellung 
von Pflanzen mit vorteilhaf ten, neuen Eigenschaf ten zum Beispiel 
zur Steigerung der landwirtschaftlichen Produktivitat , zur Quali- 
tatssteigerung bei Nahrungsmitteln oder zur Produktion bestimmter 
Chemikalien oder Pharmazeutika. 

15 

Plastiden stellen Organellen innerhalb pflanzlicher Zellen mit 
einem eigenen Genom dar. Sie haben eine wesentliche Funktion in 
der Photosynthese sowie der Aminosaure- und Lipidbiosynthese . Das 
Genom der Plastiden besteht aus einer doppelstrangigen, zirku- 

20 laren DNA mit einer durchschnittlichen GroSe von 120 bis 160 kb 
und liegt - z.B. in Blattzellen - mit ca. 1900 bis 50000 Kopien 
pro Zelle vor (Palmer (1985) Ann Rev Genet 19:325-54). Ein ein- 
zelnes Plastid tragt dabei eine Kopienzahl von ca. 50 bis 100. 
Der Begriff der Plastiden umfasst Chloroplasten, Proplastiden, 

25 Etioplasten, Chromoplasten, Amyloplasten, Leukoplasten und Elaio- 
plasten (Heifetz P (2000) Biochimie 82:655-666). Die verschiede- 
nen Formen sind in einander uberfiihrbar und entstehen alle aus 
den Proplastiden. Daher enthalten alle Auspragungs formen der 
Plastiden die gleiche Erbinf ormation. Bevorzugt werden in der 

30 Literatur jedoch grtine Zellen, die Chloroplasten als Auspragungs- 
form enthalten, als Ausgangsmaterial fur die Transformation von 
Plastiden genutzt. 

Neben Tabak wurde die Plastidentrans formation in Kartoffel 
35 (Sidorov VA et al. (1999) Plant J 19:209-216; WO 00/28014), 

Petunie (WO 00/28014), Reis (Khan MS und Malaga P (1999) Nature 

Biotech 17:910-915; WO 00/07431; US 6,153,813), Arabidopsis 

(Sikdar SR et al. (1998) Plant Cell Reports 18: 20-24; 

WO 97/32977) und Raps (WO 00/39313) gezeigt (Ubersichtsartikel : 
40 Bogorad L (2000) TIBTECH 18:257-263). Ktirzlich wurden auch trans- 

plastome Tomatenpf lanzen beschrieben (Ruf S et al. (2001) Nature 

Biotech 19:870- 875) . 

Es ist fur die Pf lanzenbiotechnologie von grofiem wirtschaf tlichen 
45 Interesse, effiziente Methoden fur die Plastidentrans formation 
zu entwickeln (McFadden G (2001) Plant Physiol. 125:50-53). Die 
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stabile Transformation von Plastiden heherer Pflanzen geh5rt 
dabei zu den grofien Herausforderungen. 

Die bei der Insertion in die nukleare DNA oft angewandte 
5 Technik der ungezielten (illegitimen) DNA-Insertion hat bei der 
Plastidentransformation den Nachteil, dass mit sehr hoher Wahr- 
scheinlichkeit auf dem gendichten plastidaren Genom ein essen- 
tielles Gen getroffen wird, was haufig letal fur die Pflanze 
ware. In Plastiden ist daher eine gezielte Insertion von Fremd- 
10 DNA vorteilhaft. 

Verschiedene Verfahren zur gezielten Insertion in das plastidare 
Genom sind beschrieben. Zuerst wurde die Plastidentransformation 
in Griinalgen beschrieben (Boynton JE et al. (1988) Science 240: 
15 1534-1538; Blowers AD et al. (1989) Plant Cell 1:123-132), spater 
in hSheren Pflanzen wie Tabak (Svab Z et al. (1990) Proc Natl 
Acad Sci USA 87:8526-8530). 

EP-A 0 251 654, US 5,932,479, US 5,451,513, US 5,877,402, 

20 WO 01/64024, WO 00/20611, WO 01/42441, WO 99/10513, WO 97/32977, 
W0 00/28014, WO 00/39313 beschreiben Methoden und DNA-Konstrukte 
zur Transformation von Plastiden hoherer Pflanzen, wobei die 
zu transformierende DNA tiber homologe Rekombination ("Doppel- 
Crossover") in das Plastom (Plastidengenom) eingebaut wird. Im 

25 allgemeinen werden auf jeder Seite der zu insertierenden Sequenz 
homologe Regionen von 1000 bp oder mehr genutzt. Dies fuhrt sehr 
schnell zu groSen Vektoren, deren Handhabung wenig komfortabel 
ist. Daruber hinaus sinkt die Effizienz der Transformation. 
Mit zunehmender Lange der zu integrierenden Fremd-DNA sinkt die 

30 Effizienz der homologen Rekombination. Ein weiterer Nachteil ist 
die Tatsache, dass fur jede Pflanzenart ein homologer Bereich 
identifiziert werden muss, der fur den Prozess der DNA Inte- 
gration mittels Doppel-Crossover genutzt werden kann. WO 99/10513 
beansprucht, eine intergenische DNA Sequenz identifiziert zu 

35 haben, die ausreichend homolog zwischen den Genomen der Chloro- 
plasten vieler hSherer Pflanzen sei und so als universelle Ziel- 
sequenz fungieren kann. Dass dieser Vektor bei anderen Arten als 
Tabak erfolgreich genutzt werden kann, wurde indies nicht nach- 
gewiesen. Im Gegenteil: In WO 01/64024 passt derselbe Erfinder 

40 den Transf ormationsvektor an Nicht -Tabak Pf lanzenarten an, indem 
er aus diesen isolierte homologe DNA-Sequenzen verwendet. Da bei 
alien der oben beschriebenen Verfahren nur wenige Rekombinations- 
ereignisse resultieren, ist eine Selektion der rekombinanten 
plastidaren DNA-Molekule erforderlich. 
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Die Plastiden-DNA hdherer Pflanzen liegt in bis zu mehreren 
tausend Kopien pro Zelle vor. Um eine stabile Integration der 
Fremd-DNA zu erreichen, mtissen alle Kopien der Plastiden-DNA 
gleichermafien verandert werden. Im Fall der Plastidentrans- 
5 formation spricht man davon, den homotransplastomen Zustand 

erreicht zu haben. Diesen Zustand erreicht man durch einen soge- 
nannten "segregation and sorting" Prozess, indem man die Pflanzen 
unter standigen Selektionsdruck halt. Durch den anhaltenden 
Selektionsdruck werden wahrend der Zell- und Plastidenteilung 

10 solche Plastiden angereichert , in denen bereits viele Kopien der 
plastidaren DNA verandert wurden. Der Selektionsdruck wird auf- 
recht gehalten, bis der homotransplastome Zustand erreicht ist 
(Guda C et al. (2000) Plant Cell Reports 19:257-262). Es ist eine 
groSe Herausf orderung, alle Kopien des Plastidengenoms zu ver- 

15 andern, um homotransplastome Pflanzen zu erhalten, die auch uber 
Generationen ohne Zugabe eines Selektionsmittels das Fremdgen 
stabil in ihr plastidares Genom eingebaut haben (Bogorad L (2000) 
TIBTECH 18:257-263). Zusatzlich zu dem standigen Selektionsdruck 
wird gegebenenfalls durch wiederholte Regeneration bereits trans- 

20 formierten Gewebes das Erreichen des homotransplastomen Zustand 
sichergestellt (Svab Z und Maliga P (1993) Proc Natl Acad Sci USA 
90:913-917). Dies jedoch schrankt das Pf lanzenmaterial , welches 
fur die Plastidentrans formation zur Verfugung steht, ein. Es wird 
daher vorgeschlagen, das Transgen ggf . mit einem anderen Gen, 

25 welches essentiell fur das Uberleben der Pflanze ist, zu koppeln. 
Allgemein wird als einzige Pflanzenart, deren Plastiden effizient 
trans formiert werden konnen, Tabak angesehen. Die Limitierung der 
Technik wird vor allem in der gegenwartig zur Verftigung stehenden 
Gewebekultur und den Regenerationsprotokollen gesehen (Ruf, S. 

30 et al. 2001 Nature Biotech. 19: 870-875). Gewebekultur-Techniken 
und Selektionsprozesse sind meist nicht universell auf alle 
Pflanzenarten anwendbar und stellen eine wesentliche Limitierung 
der Plastidentransformation dar, die insbesondere die Ubertrag- 
barkeit der Methode auf andere Arten als Tabak betrifft (Kota M 

35 et al. (1999) Proc Natl Acad Sci USA 96:1840- 1845). Eine kttrz- 
lich veroffentlichte Transformation von Plastiden von Tomate 
basiert auf Modif ikationen im Regenerations- und Selektionsschema 
(Ruf S et al. (2001) Nature Biotech 19:870-875), die jedoch 
kosten- und zeitintensiv sind. Ein anderer Ansatz zielt darauf 

40 ab, die Anzahl der Plastiden pro Zelle und der DNA Molekule pro 
Plastid zu reduzieren, um so weniger DNA Molekule modifizieren zu 
mtissen (Bogorad L (2000) TIBTECH 18:257-263). Insgesamt sind die 
Selektions- und Segregationsprozesse sehr zeitaufwendig. 

45 WO 99/10513 beschreibt ein Verfahren bei dem auf dem zu trans- 
formierenden Plasmid ein plastidarer ORI (origin of replication, 
Replikationsursprung) lokalisiert wird, um so die Anzahl der fur 
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die Integration in das Plastidengenom zur Verfugung stehenden 
Kopien des zu transf ormierenden Vektors zu erhShen (Guda C et al. 
(2000) Plant Cell Reports 19:257-262). 

5 Die Notwendigkeit die Technik der Plastidentransf ormation zu ver- 
bessern wird auch bei Heifetz und Tuttle erwahnt (Heifetz P und 
Tuttle AM (2001) Curr Opin Plant Biol 4:157-161). WO 00/32799 
lehrt, die Effizienz der Plastidentransf ormation durch den Ein- 
satz von Pflanzen mit vergrSSerten Plastiden zu erhohen. Dadurch 
10 ergibt sich eine groSe Oberflache der Plastiden, durch die die 
zu trans formierende DNA leichter in die Plastiden eindringen 
kann. Der Mechanismus der DNA Integration erfolgt aber auch hier 
mittels konventioneller homologer Rekombination wie bei den oben 
beschriebenen Verfahren. 

15 

Die homologe Rekombination selber wird nicht als Ansatzpunkt fur 
weitere Optimierungsmoglichkeiten diskutiert, da sie in Plastiden 
als hoch und damit nicht limitierend angesehen wird (Bock R und 
Hagemann R (2000) Progress in Botany. 61:76-90; Maliga P et al. 
20 (1994) Homologous recombination and integration of foreign DNA 
in plastids of higher plants. In: Homologous recombination and 
gene silencing in plants. Paszkowski J ed., Kluwer Academic 
publishers, S. 83-93; Carrer H und Maliga P (1995) Bio/Technology 
13: 791-794) . 

25 

Allgemein werden also optimierte Gewebe- und Regenerations- 
techniken als Ansatz favorisiert, die jedoch den Nachteil haben, 
dass sie nicht universell auf alle Pf lanzenarten anwendbar sind, 
sondern jeweils an deren Eigenarten angepasst werden miissen. Nur 

30 zwei Arbeiten schlagen vor, auch durch eine Verbesserung der 

Insertionshaufigkeit der zu transf ormierenden DNA in die DNA von 
Organellen die Transformation dieser zu verbessern. In dem einen 
Pall wird dabei keine technische Lehre beschrieben, wie man eine 
Verbesserung der Integrationshauf igkeit in plastidare DNA er- 

35 reichen kann (van Bel AJE et al. (2001) Curr Opin Biotechnol. 12: 
144-149). Odom OW et al. (2001 Mol. Cell Biol. 21: 3472-3481) 
schlagen allgemein vor, die Transformationsef fizienz durch Ver- 
wendung selten schneidende Restriktionsendonuklease zu steigern. 

40 Sequenzspezifische Rekorabinasen bewirken - in Abhangigkeit von 
der Lokalisation und Orientierung der entsprechenden Erkennungs- 
sequenzen - eine Insertion, Excision, Translokation oder 
Inversion von Nukleinsauref ragmenten. Es wird zwischen den 
Familien der Integrasen, wie beispielsweise Cre oder Flp, und 

45 der Familie der Resolvasen/Invertasen, wie beispielsweise die 
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4>C31 Rekombinase, die TP901-1 Rekombinase, die Gin Rekombinase, 
die Hin Rekombinase etc. unterschieden. 

Diese Enzyme erkennen in der Regel relativ kurze, spezifische 
5 Nukleinsauresequenzen, die sowohl der Erkennung als auch der 
Rekombination dienen. Beispielhaft seien die Cre Rekombinase 
(Sternberg und Hamilton (1981) J Mol Biol 150:467-486), die Flp 
Rekombinase (Brosch et al. (1982) Cell 29:227-234) und die R 
Rekombinase (Matsuzaki et al. (1990) J Bacteriology 172:610-618) 
10 zu nennen. 

Die Cre Rekombinase erlaubt es dem Bacteriophagen PI, wahrend 
seines Lebenszyklus ein monomeres Phagengenom zu erhalten, indem 
die wahrend der Replikation erzeugten Sequenzduplikationen durch 
15 die Rekombinase ausgeschnitten werden (Guo et al. (1997) Nature 
389:40-46). Cre ist ein 38 kD Protein und katalysiert die 
Rekombination zwischen zwei 34 Basenpaarsequenzen (loxP) . 

loxP 5 ' -ATAACTTCGTATA GCATACAT TATACGAAGTTAT-3 ' 

20 

LoxP besteht aus zwei 13 Basenpaar palindromischen Sequenzen 
getrennt von einer 8 Basenpaar Kernseguenz ("Spacer"). Die 
"Repeat "-Sequenzen fungieren als Bindeseguenzen der Cre-Rekombi- 
nase, wohingegen der Sequenzschnitt ("Kreuzung der zu rekombi- 

25 nierenden Sequenzen") in der "Spacer" Region erfolgt. Vermutlich 
wird ein tibergangskomplex aus vier Cre-Molekiilen und zwei loxP 
Sequenzen gebildet (Guo et al . (1997) Nature 389:40-46). Die 
Asymmetrie der "Spacer" Region bedingt die Richtung der Rekombi- 
nation. Sind die beiden Rekombinationssequenzen gleichgerichtet, 

30 so erfolgt Integration bzw. Excision. Ist die Orientierung gegen- 
laufig, so erfolgt Inversion (Yang and Mizuuchi (1997) Structure 
5:1401-1406). Cre ist in einer Vielzahl von Organismen aktiv, 
einschliefclich Pflanzen (Albert et al. (1995) Plant J 7:649-659; 
Dale und OW (1990) Gene 91:79-85; Odell et al . (1990) Mol Gen 

35 Genet 223:369- 378). Cre kann eine sequenzspezifische Insertion 
beispielsweise in Hefe oder Saugerzellen bewirken (Sauer und 
Henderson (1990) New Biol 2:441-449). 

Das Flp Inversionssystem der Hefe S. cerevisiae (2p. Plasraid) 
40 basiert auf der Nutzung einer Int-Flp Rekombinase. Flp erkennt 
eine Region - genannt FRT - bestehend zwei jeweils 13 Basenpaar 
langen invertierten "Repeaf'-Sequenzen, getrennt durch eine 
Sequenz (Spacer) von 8 bp. Ein in der naturlichen Sequenz weiter- 
hin vorliegender dritter Repeat scheint fur die Funktionalitat 
45 nicht essentiell zu sein. Essentiell ist eine invertierte Lokali- 
sation der Repeats #1 und #2. Der versetzte endonukleolytische 
Schnitt erfolgt innerhalb der 8 bp Sequenz.. Die Lange des Spacers 
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ist wichtig. Eine Insertion von weiteren 10 bp kann jedoch 
toleriert werden. Das System basiert auf zwei f lankierenden 
Zielsequenzen. 

5 #1 spacer #2 #3 

FRT 5-GAAGTTCCTATaC TTTCTAGA GAATAGGAACTTC t C GAATAGGAACTTC 3 -3 ' 

Wie Cre ist auch Flp in verschiedenen Systemen funktionell, 
einschliefilich im pflanzlichen Zellkern (Lyznik et al. (1993) 
10 Nucl Acids Res 21:969-975). 

Nattirlicherweise sind viele Rekombinationssysteme reversibel. 
Beim Nutzen der Rekombinasen wie Cre oder FLP liegt das Gleich- 
gewicht der Reaktion weit auf der Seite der Excision. Daher sind 

15 diese Systeme - ohne weitere Modifikation - nicht far die Inte- 
gration von Femd-DNA, sondern nur fur die Excision (z.B. Marker- 
excision) geeignet. So wurde das Cre-lox System des Phagen PI 
genutzt, urn den Selektionsmarker aadA wieder aus dem plastidaren 
Genom zu entfernen (Hajdukieicz PTJ et al. (2001) Plant J 

20 27:161-170; Corneille S et al. (2001) Plant J 27: 171-178; 

WO01/21768; W001/29241) . Es gibt bisher keine Beschreibungen zum 
Nutzen von Rekombinasen bei intermolekularen Reaktionen, ins- 
besondere zur Integration von Fremd-DNA, in Plastiden. Wirts- 
organismus-unabhangige Rekombinationssysteme sind in Plastiden 

25 bislang lediglich im Zusammenhang einer Deletion definierter 
Sequenzen aus dem Plastom beschrieben worden. 

Die Nutzung von seguenzspezif ischen Rekombinasesystemen zur 
Integration heterologer Sequenzen in die chromosomale DNA (u.a. 

30 von Pflanzen) ist beschrieben. Dabei handelt es sich - im Unter- 
schied zu der Excision, die intramolekular verlauft - um ein 
intermolekulares Ereignis. So wurde versucht, die Integrations- 
rate im Vergleich zur Excisionsrate zu erh.6h.en, indem bei einem 
Rekombinationsereignis zwischen zwei nicht identischen aber noch 

35 von der Rekombinase genutzten Erkennungsregionen wenigstens eine 
hybride Rekombinase-Erkennungsstelle entsteht, die nicht mehr 
oder nur sehr ineffizient von der entsprechenden Rekombinase 
genutzt werden kann. Damit wird die Excision des gerade inte- 
grierten DNA Fragmentes unterdruckt (Sauer B (1994) Curr Opin 

40 Biotechnol 5:521-527) und eine Stabilisierung der Integration 
erreicht (Albert H et al. (1995) Plant J 7:649-659). Ahnliches 
wird durch eine gezielte, zeitlich eng begrenzte Expression der 
enstprechenden Rekombinase - wie Cre oder Flp - erreicht (Metzger 
D und Feil R (1999) Curr Opin Biotechnol 10:470-476; Albert H 

45 et al. (1995) Plant J 7:649-659). 
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Die aktuelle Forschung zur Optimierung der Plastidentrans- 
formation richtet sich nicht auf eine Optimierung der homologen 
Rekombination, sondern zum Beispiel auf verbesserte Selektions- 
marker, verbesserte Selektions- und Regenerationstechniken etc. 

5 

Die Rekombinase des Phagen 3>C31 wurde schon fur biotechnologische 
Applikationen in der Vergangenheit eingesetzt. US 5,190,871 be- 
schreibt ein Verfahxen, mit dessen Hilfe ein Plasmid mit Hilfe 
der Erkennungsstellen-spezifischen Integrationsfunktion des 

10 Phagen *C31 in das Genom eines Streptomyceten eingebaut wird. Die 
Integration erfolgt an die in diesen Wirtszellen naturlich vor- 
handene Erkennungsregion attB. WO 00/11155 nutzt Rekombinasen zum 
Einbau von Fremd-DNA in eukaryotische Genome. Dabei werden die 
Rekombinasen unter der Kontrolle eines eukaryotischen Promotors 

15 exprimiert. Die Rekombination erfolgt dabei zwischen einer 

Erkennungsregion auf dem zu trans formierenden Plasmid und pseudo- 
Erkennungsregionen, die sich nativ im Genom des Eukaryoten be- 
finden. In WO 00/11155 wird eine Erkennungsregion attB oder attP 
in das Genom einer eukaryotischen Zelle eingebracht. Dies wird 

20 nur far tierische Zellen gezeigt und es gibt keine technische 
Offenbarung, dass und wie man solche Erkennungsregionen auch in 
Organellen einbringen konnte. Im Gegensatz zum Kerngenom, welches 
in der angesprochenen Erfindung betrachtet wurde, indem nur eine 
(heterozygot) bis zwei (homozygot) Genomkopien vorliegen, gibt 

25 es viele Plastiden pro Zelle und viele DNA-Kopien pro Plastid. 

Wahrend WO 00/11155 nur Untersuchungen in Bakterien und 
tierischen Zellen durchfiihrt, beschreibt WO 01/07572 das Nutzen 
solcher Rekombinasen auch im Kerngenom von Pflanzen. Auch hier 

30 wird nicht gezeigt, dass solche Rekombinasen die DNA Struktur der 
Plastiden-DNA erkennen und dort eine effiziente Anwendung auf- 
grund der Vielzahl und raumlichen Trennung dieser DNA Molekule 
mSglich ist. Tatsachlich stellte sich eine solche Aufgabe dem 
Erfinder auch gar nicht, da er ein Verfahren suchte, das eine 

35 Alternative fur die im Kerngenom nur mit sehr geringen Freguenzen 
auftretende Homologe Rekombination darstellt. 

Unterschiedliche Rekombinasen bevorzugen unterschiedliche 
Konformationen der DNA, die sie als Substrate nutzen (Sadowski 

40 PD (1986) J Bacterid 165:341-347). Es ist daher unklar ob und 
welche Rekombinasen - neben dem Cre-lox System - in Plastiden 
funktionieren. Es wurden bisher noch nie Rekombinasen der 
Resolvase/Invertase Familie in Plastiden hoherer Pflanzen einge- 
setzt. Da die Nukleosomen ganzlich anders aufgebaut sind als die 

45 Chromosomen im Zellkern, konnte auch nicht aus der erf olgreichen 
Verwendung von bestimmten Rekombinasen im pflanzlichen Zellkern 
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davon ausgegangen werden, dass diese auch mit plastidarer DNA als 
ein Substrat genutzt werden konnen. 

Die sogenannte Erkennungsstellen-spezif ische Integration (site- 
5 specific integration) wurde bisher nur im Kerngenom von Pflanzen 
und Tieren angewendet.' Ziel der im Stand der Technik beschrie- 
benen Arbeiten war die Bereitstellung eines Alternatiwerf ahrens 
zu der homologen Rekombination ftir eine sequenzspezif ische Inte- 
gration in das Kerngenom. Im Kerngenom hoherer Eukaryonten sind 

10 Systeme wie Cre oder Pip allenfalls so effizient wie die dort. 
normalerweise auftretende illegitime Rekombination, meist jedoch 
wesentlich inef f izienter (Sauer B (1994) Curr Opin Biotechnol 
5:521-527). Im Unterschied zu Kerngenom liegt das Plastom in 
zahlreichen, meist mehreren tausend Kopien pro Zelle vor, so dass 

IS hier besonders hohe Anforderungen an die Effizienz der Insertion 
gestellt werden mussen. 

Im Unterschied zu Plastiden ist die Insertion in die Kern-DNA 
mittels homologer Rekombination problematisch und erfolgt meist 

20 mittels zufalliger illegitimen Integration. Dies zeigt, dass im 
Kern-Genom etablierte Techniken nicht unbedingt auf die Plastiden 
ubertragen werden kSnnen. Bei Plastiden hSherer Pflanzen findet 
im Gegensatz zu der Situation im Kern nahezu ausschlieSlich und 
mit hoher Effizienz eine Integration iiber homologe Rekombination 

25 statt (Bock R und Hagemann R (2000) Progress in Botany 61:76-90; 
Maliga P et al. (1994) Homologous recombination and integration 
of foreign DNA in plastids of higher plants. In Homologous recom- 
bination and gene silencing in plants. Paszkowski J, ed. (Kluwer 
Academic publishers) , S. 83-93). 

30 

Die Effizienz der homologen Rekombination zur DNA-Integration 
in das Plastom wurde allgemein nicht als limitierender Faktor 
angesehen und - im Gegenteil - als unkritisch eingestuft, so dass 
der Einsatz von Rekombinasen zur Integration von Fremd-DNA in die 
35 Plastiden-DNA tiberflussig erscheint. 

Wie die oben beschriebenen Verfahren und Probleme bei der 
Plastidentransformation deutlich hervorheben, ist die Bereit- 
stellung neuer Verfahren zur Herstellung homotransplastomer 

40 Pflanzen ein lange bestehendes ungel6stes Bedurfnis der Pflanzen- 
biotechnologie. Ein weiteres Bedurfnis ist die Vermeidung von 
Antibiotika- oder Herbizidselektionsmarkern aus Grunden der 
Zulassung und Verbraucherakzeptanz . Fur die Plastidentrans- 
formation ist bisher noch kein Verfahren beschrieben, dass ohne 

45 einen solchen Selektionsmarker auskommt. 
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Es ergab sich daher die Aufgabe, neue Verfahren zu entwickeln, 
die eine effiziente Integration von Fremd-DNA in alle Kopien der 
Plastiden-DNA sicher stellt und so eine effiziente Selektion ent- 
sprechender homotransplastomer Pflanzen ermoglicht. Dartiber hin- 
5 aus stellt sich die Aufgabe, effiziente Verfahren bereitzustellen 
fUr die Integration insbesondere groSer DNA Fragmente in das 
Plastom in einem einzigen Transformationsschritt . Diese Aufgabe 
wurde durch Bereitstellung des erf indungsgemafien Integrations- 
verfahrens gelost. 

10 

Ein erster Gegenstand der Erfindung betrifft ein Verfahren 
zur sequenzspezifischen Integration einer DNA-Sequenz in die 
plastidare DNA eines pflanzlichen Organismus oder von diesem 
abgeleitete Zellen, dadurch gekennzeichnet, dass 

15 

a) die plastidaren DNA-Molekule besagten pflanzlichen Organismus 
oder von diesem abgeleitete Zelle mindestens eine Rekombi- 
nationssequenz Rl enthalten und 

20 b) i) mindestens ein Transf ormationskonstrukt umfassend eine 
Insertionssequenz zumindest einseitig flankiert von 
mindestens einer weiteren Rekombinationssequenzen R2 
sowie 

25 ii) mindestens eine sequenzspezif ische Rekombinase geeignet 

zur Induktion von Rekombinationsereignissen an besagten 
Rekombinationssequenzen Rl und R2 

in mindestens einem Plastid besagten pflanzlichen Organismus 
30 oder von diesem abgeleiteten Zellen zusammengebracht werden, 

und 

c) die Insertionssequenz in die plastidare DNA unter Rekombi- 
nation von Rl mit R2 insertiert, und 

35 

d) Pflanzen oder Zellen isoliert werden, bei denen die 
Insertionssequenz in die plastidaren DNA-Molekule insertiert 
wurde. 

40 Das System erm5glicht uberraschenderweise eine erhebliche 

Steigerung der Ef fizienz bei der Herstellung iiberwiegend homo- 
transplastomer Pflanzen. Dabei wird sowohl die Ef fizienz der 
Insertion in die plastidare DNA als auch die Effizienz des Selek- 
tionsprozess uberwiegend homotransplastomer Pflanzen gesteigert. 

45 Besonders vorteilhaft ist, dass bei Ausnutzen des erfindungs- 
gemafien Verfahrens auf homologe Bereiche in den Transformations- 
vektoren verzichtet werden kann. Dadurch werden die Vektoren 
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kleiner und leichter handhabbar. Ferner wird die Effizienz der 
Plastidentransformation und damit die Gesamtef f izienz des Ver- 
fahrens gesteigert. Letzteres ist insbesondere dann von Inter- 
esse, wenn im Rahmen der Insertionssequenz groSe DNA-Fragmente 
5 in das Plastom eingebracht werden sollen, was - beispielsweise - 
im Fall der Einbringung mehrerer Gene gegeben ist . Dadurch 
ist das erfindungsgemaEe Verfahren, der im Stand der Technik 
beschriebenen Insertion mittels homologer Rekombination {z.B. 
Doppel-Crossover) uberlegen, da beim letzteren die Effizienz der 
10 Transformation (und somit die Gesamtef f izienz) durch die zusatz- 
lich erforderlichen Homologiebereiche reduziert wird. Somit lost 
die vorliegende Erfindung das Problem der Integration grofier DNA 
Fragmente (> 4kb) in einem einzigen Transformationsschritt mit 
ausreichend hoher Effizienz. 

15 

Vorteile des hier beschriebenen Verfahrens sind: Es muss nur ein- 
mal eine sogenannte Masterpf lanze - d.h. eine Pf lanze, die in 
Ihrem Plastom eine Rekombinationssequenz Rl enthalt und als Aus- 
gangspflanze fur das erfindungsgemaSe Verfahren fungieren kann - 

20 in einer entsprechenden Art erstellt werden. Es kQnnen auch 

nicht-modifizierte Pflanzen als Masterpf lanzen verwendet werden, 
soweit deren Plastom naturlicherweise eine Erkennungssequenz fur 
eine Rekombinase enthalt. Die Plastiden der vorgenannten Master- 
pf lanzen konnen anschlieSend mit Hilfe des erf indungsgemaSen, 

25 wirtsunabhangigen Integrationsmechanismus transf ormiert werden. 
Dadurch kann man die Effizienz der Plastidentransformation in den 
Pflanzenspezies steigern, in denen die Integration der Fremd-DNA 
in das Plastom ein limitierender Faktor ist. Auf den Trans- 
formationsvektoren werden nur wenige Basenpaar lange Sequenzen- 

30 abschnitte benStigt, die den Integrationsort in das Plastom 
bestimmen. Im Gegensatz dazu benotigt man fur die Integration 
mittels Doppel-Crossover Sequenzabschnitte mit extensiver Homo- 
logie zum Plastom der Wirtspf lanze. Damit konnen die Trans- 
formationsvektoren der vorliegenden Erfindung verhaltnismafcig 

35 klein gehalten werden. Daruber hinaus ist die wirtsunabhangige 
Integration auch weitgehend unabhangig von der Lange der in die 
Masterpf lanze einzubringenden DNA. Es konnen leicht sehr viele 
Gene oder sehr gro&e Gene in die Organellen einer solchen Master- 
pf lanzen mit dem hier beschriebenen Verfahren integriert werden. 

40 

Gegeniiber der Transformation des Zellkerns hat die Transformation 
von Plastiden zahlreiche Vorteile. Unter anderem sind zu nennen: 

a) Wahrend die homologe Rekombination in die nukleare DNA nur 
45 schwer zu realisieren ist, kann in Plastiden DNA leicht an 

einem vordef inierten Ort mittels Doppel-Crossover, einer Form 
der homologer Rekombination, integriert werden.. Positions- 
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effekte oder "Genesilencing", die man bei Kerntrans- 
formationen aufgrund der illegitimen Integration an einen 
nicht vordefinierten Lokus findet, werden so vermieden. 

5 b) Es kSnnen sehr hohe Expressionslevel erreicht werden, ver- 
mutlich aufgrund der hohen Kopiezahl der plastidaren DNA. 

c) Die DNA der Plastiden wird bei heheren Pflanzen in der Regel 
nur maternal vererbt, so dass die eingebrachte Fremd-DNA 

10 nicht uber Pollen verbreitet und ein Auskreuzen somit 

effektiv unterbunden werden kann. 

d) Die prokaryotische Natur der Plastiden ermSglicht die 
Expression von Genen im Rahmen einer polycistronischen 

15 Operonstruktur . Daher ist es nicht notwendig, jedes zu 

exprimierende Gen mit einem eigenen Promotor etc. auszu- 
rusten. Dies erleichtert das Einbringen vieler Gene auf 
einmal, etwa um ganze Biosynthesewege in die Plastiden 
einzubringen . 

20 

"Plastid" meint Proplastiden sowie alle daraus aus hervorgehenden 
Organellen wie beispielsweise Chloroplasten, Etioplasten, Chromo- 
plasten, Amyloplasten, Leukoplasten , Dermaplasten und Elaio- 
plasten (Heifetz P (2000) Biochimie 82:655-666). 

25 

"Plastom" meint das Genom, also die Gesamtheit der genetischen 
Information, eines Plastids. 

"Homotransplastom" meint einen transplastomen und homoplastomen 
30 Zustand. 

"Transplastom" meint in Bezug auf beispielsweise eine Pflanze, 
Zelle, Gewebe, Plastid Oder plastidare-DNA alle solche durch gen- 
technische Methoden zustande gekommene Formen der vorgenannten , 
35 die eine plastidSre DNA umfassen, die durch gentechnische 
Methoden modifiziert wurde, wobei die Modifikation beispiel- 
haft Substitutionen, Additionen, Deletionen, Inversion oder 
Insertionen eines oder mehrerer Nukleotidreste umfassen kann. 

40 "Heteroplastom" meint das Vorliegen einer gemischten Population 
verschiedener plastidarer DNAs innerhalb eines einzelnen 
Plastides oder innerhalb einer Population von Plastiden inner- 
halb einer pflanzlichen Zelle oder Gewebe. 

45 "Homoplastom" meint eine einheitliche Population von plastidarer 
DNA innerhalb eines einzelnen Plastides oder innerhalb einer 
Population von Plastiden innerhalb einer pflanzlichen Zelle oder 
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Gewebe. Homoplastome Zellen, Gewebe oder Pflanzen sind genetisch 
stabil, da sie nur eine Art plastidarer DNA umfassen d.h. sie 
bleiben im allgemeinen homoplastom auch wenn den Selektionsdruck 
nicht mehr anhalt. Durch Selbstung erhaltene Nachkommen sind 
5 ebenfalls homoplastom. 

Im Rabmen dieser Erfindung meint "uberwiegend homoplastom" oder 
"iiberwiegend homotransplastom" all solche Pflanzen oder Zellen, 
bei denen der Anteil der erwiinschten plastidaren hinsichtlich 

10 eines Merkmals veranderten DNA-Molekiile - beispielsweise mit 
einer Rekombinationssequenz - mindestens 50 %, bevorzugt min- 
destens 70 %, ganz besonders bevorzugt mindestens 90 %, am 
meistens bevorzugt mindestens 95 % von der Gesamtheit aller 
plastidaren DNA-Molekiile in einer Pflanze oder einem Gewebe, 

15 Zelle bzw. Plastid derselben betragt. Uberwiegend homoplastome 
oder uberwiegend homotransplastome Pflanzen konnen durch weiteres 
Aufrechterhalten des Selektionsdruckes und gegebenenfalls wieder- 
holenden Regenerationen in homoplastome oder homotransplastome 
Pflanzen umgewandelt werden. In einer besonderen Ausfiihrungsf orm 

20 ist daher eine uberwiegend homoplastome bzw. homotransplastome 
Pflanze rein homoplastom bzw. homotransplastom. Eine Pflanze, die 
beispielsweise bezuglich einer Rekombinationssequenz uberwiegend 
homoplastom bzw. homotransplastom oder rein homoplastom bzw. 
homotransplastom ist, wird infolge als "Masterpf lanze" bezeich- 

25 net. Der Anteil der erwttnschten plastidaren hinsichtlich eines 
Merkmals veranderten DNA-Molekiile kann beispielsweise mittels 
Southern Analyse - wie beispielhaft in Beispiel 4 beschrieben - 
in der dem Fachmann bekannten Weise ermittelt werden. Das 
Verhaltnis zwischen den plastidaren Ausgangs-DNA Molekiilen 

30 und den hinsichtlich eines Merkmals verSnderten plastidaren 
DNA-Molekiilen lasst sich durch Vergleich der Intensitat der 
jeweiligen Banden bestimmen. 

'Pflanzlicher Organismus oder von diesem abgeleitete Zellen" 
35 meint allgemein jede Zelle, Gewebe, Teile oder Vermehrungsgut 
(wie Samen oder Frtichte) eines Organismus, der zur Photosynthese 
befahigt ist. Eingeschlossen sind im Rahmen der Erfindung 
alle Gattungen und Arten hoherer und niedrigerer Pflanzen des 
Pf lanzenreiches . Einjahrige, mehrjahrige, monocotyledone und 
40 dicotyledone Pflanzen sind bevorzugt. Eingeschlossen sind reife 
Pflanze, Saatgut, Sprosse und Keimlinge, sowie davon abgeleitete 
Teile, Vermehrungsgut (zum Beispiel Knollen, Samen oder Friichte) 
und Kulturen, zum Beispiel Zell- oder Kalluskulturen. Reife 
Pflanzen meint Pflanzen zu jedem beliebigen Entwicklungsstadium 
45 jenseits des Keimlings. Keimling meint eine junge, unreife 
Pflanze in einem friihen Entwicklungsstadium. 
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Bevorzugt sind Pflanzen nachfolgender Pf lanzenf amilien: Amaranth- 
aceae, Asteraceae, Brassicaceae, Carophyllaceae, Chenopodiaceae , 
Compositae, Cruciferae, Cucurbitaceae, Labiatae, Leguminosae , 
Papilionoideae, Liliaceae, Linaceae, Malvaceae, Rosaceae, 
5 Rubiaceae, Saxif ragaceae, Scrophulariaceae, Solanacea, 
Sterculiaceae, Tetragoniacea, Theaceae, Umbelliferae. 

Bevorzugte monokotyle Pflanzen sind insbesondere ausgewahlt aus 
den monokotylen Kulturpf lanzen, wie zum Beispiel der Farailie der 
10 Gramineae wie Reis, Mais, Weizen oder andere Getreidearten wie 
Gerste, Hirse, Roggen, Triticale oder Hafer sowie dem Zuckerrohr 
sowie alle Arten von Grasern. 

Bevorzugte dikotyle Pflanzen sind insbesondere ausgewahlt aus den 
15 dikotylen Kulturpf lanzen, wie zum Beispiel 

- Asteraceae wie Sonnenblume, Tagetes oder Calendula und andere 
mehr , 

20 - Compositae, besonders die Gattung Lactuca, ganz besonders die 
Art sativa (Salat) und andere mehr, 

- Cruciferae, besonders die Gattung Brassica, ganz besonders die 
Arten napus (Raps) , campestris (Rube) , oleracea cv Tastie 

25 (Kohl), oleracea cv Snowball Y (Blumenkohl) und oleracea cv 
Emperor (Broccoli) und weitere Kohlarten; und der Gattung 
Arabidopsis, ganz besonders die Art thaliana sowie Kresse oder 
Canola und andere mehr, 

30 - Cucurbitaceae wie Melone, Kvirbis oder Zucchini und andere mehr, 

- Leguminosae besonders die Gattung Glycine, ganz besonders die 
Art max (Sojabohne) Soja sowie Alfalfa, Erbse, Bohnengewachsen 
oder Erdnuss und andere mehr 

35 

- Rubiaceae, bevorzugt der Unterklasse Lamiidae wie beispiels- 
weise Coffea arabica oder Coffea liberica (Kaf festrauch) und 
andere mehr, 

40 - Solanaceae besonders die Gattung Lycopersicon, ganz besonders 
die Art esculentum (Tomate) und die Gattung Solanum, ganz be- 
sonders die Art tuberosum (Kartoffel) und melongena (Aubergine) 
sowie Tabak oder Paprika und andere mehr, 

45 - Sterculiaceae, bevorzugt der Unterklasse Dilleniidae wie bei- 
spielsweise Theobroma cacao (Kakaostrauch) und andere mehr, 
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- Theaceae, bevorzugt der Unterklasse Dilleniidae wie beispiels- 
weise Camellia sinensis oder Thea sinensis (Teestrauch) und 
andere mehr, 

5 - Umbelli ferae, besonders die Gattung Daucus (ganz besonders 
die Art carota (Karrotte) ) und Apium (ganz besonders die Art 
graveolens dulce (Selarie) ) und andere mehr; und die Gattung 
Capsicum, ganz besonders die Art annum (Pfeffer) und andere 
mehr, 

10 

sowie Lein, Soja, Baumwolle, Hanf, Flachs, Gurke, Spinat, Mohre, 
Zuckerrube und den verschiedenen Baum-, Nuss- und Weinarten, ins- 
besondere Banane und Kiwi. 

15 Umfasst sind ferner Schmuckpf lanzen, Nutz- oder Zierbaume, 

Blumen, Schnittblumen, Straucher oder Rasen. Beispielhaft aber 
nicht einschrankend seien zu nennen Angiospermen, Bryophyten 
wie zum Beispiel Hepaticae (Leberbliimchen) und Musci (Moose) ; 
Pteridophyten wie Fame, Schachtelhalm und Lycopoden; Gymno- 

20 spermen wie Koniferen, Cycaden, Ginkgo und Gnetalen, die Familien 
der Rosaceae wie Rose, Ericaceae wie Rhododendrons und Azaleen, 
Euphorbiaceae wie Weihnachtssterne und Kroton, Caryophyllaceae 
wie Nelken, Solanaceae wie Petunien, Gesneriaceae wie das 
Usambaraveilchen, Balsaminaceae wie das Springkraut, Orchidaceae 

25 wie Orchideen, Iridaceae wie Gladiolen, Iris, Freesie und Krokus, 
Compositae wie Ringelblume, Geraniaceae wie Geranien, Liliaceae 
wie der Drachenbaum, Moraceae wie Ficus, Araceae wie Philodendron 
und andere mehr. 

30 Pflanzliche Organismen im Sinne der Erfindung sind weiterhin 
weitere photosynthetisch aktive befahigte Organismen, wie zum 
Beispiel Algen, Cyanobakterien sowie Moose. Bevorzugte Algen sind 
Grunalgen, wie beispielsweise Algen der Gattung Haematococcus , 
Phaedactylum tricornatum, Volvox oder Dunaliella. Insbesondere 

35 bevorzugt ist Synechocystis . Cyanobakterien wie z.B. Synecho- 
cystis sind photosynthetisch aktive Organismen, die zwar keine 
Plastiden beinhalten aber quasi Plastiden darstellen und - wie 
die Plastiden - zahlreiche Kopien ihrer genomischen DNA ent- 
halten. Sie gelten darftberhinaus - entwicklungsbiologisch gesehen 

40 - als Vorlaufer der heutigen Plastiden (Bauer J et al. (2001) 
Cell Mol Life Sci 58 (3 ) : 420-33 ) . 

Am meisten bevorzugt sind Arabidopsis thaliana, Nicotiana 
tabacum, Tagetes und Brassica napus sowie alle Gattungen und 
45 Arten, die als Nahrungs- oder Futtermittel zum Einsatz kommen, 
wie die beschriebenen Getreidearten, oder sich zur Herstellung 
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von 6len eignen, wie Olsaaten, Nussarten, Soja, Sonnenblume, 
Kiirbis und Erdnuss. 

"Rekombinase" meint im Rahmen dieser Erfindung sequenzspezif ische 
5 Rekombinase. Sequenzspezif ische Rekombinasen umfasst Proteine, 
die einen reziproken Austausch von DNA Doppelstrangen zwischen 
zwei DNA Segmenten katalysieren kSnnen, wobei die jeweilige 
Rekombinase eine Preferenz fur DNA Segmente mit einer bestimmten 
Nukleinsauresequenz hat. Besagte miteinander rekombinierende DNA 
10 Sequenzen sind nicht notwendigerweise identisch. 

Die im Rahmen dieser Erfindung verwendeten Rekombinasen werden 
insbesondere zur Integration von DNA Sequenzen verwendet. Sind 
fur diesen Prozess - neben der Rekombinase selber - weitere 

15 Faktoren erforderlich, so ist der Komplex aus Rekombinase und den 
entsprechenden Integrationsfaktoren selber auch als Rekombinase 
im Sinne der Erfindung zu verstehen. Beispielsweise ist eine 
Integration mittels der X-Rekombinase nur dann effizient moglich, 
wenn auch zugleich der IHF ("integration host factor") vorhanden 

20 ist. In einer bevorzugten Aus fuhrungs form umfasst besagter 

Rekombinase-Komplex keine Faktoren, die ein Ausschneiden zuvor 
durch Rekombination insertierter DNA-Sequenzen begiinstigen. Bei- 
spielsweise umfasst der Komplex aus ^-Rekombinase und IHF nicht 
noch zusatzlich den Faktor xis. 

25 

Bevorzugt ist die Geschwindigkeit einer Rekombinationsreaktion 
einer sequenzspezif ischen Rekombinase unter Einsatz ihrer 
bevorzugten Erkennungssequenz (beispielsweise ihrer naturlichen 
Erkennungssequenz ) mindestens zehnfach so hoch wie fur den Ein- 

30 satz einer beliebigen anderen nicht-homologen Sequenz, bevorzugt 
mindestens hundertfach so hoch, besonders bevorzugt mindestens 
eintausendfach so hoch, am meistens bevorzugt mindestens zehn- 
tausendfach so hoch. Dabei meint eine "nicht-homologe Sequenz" 
bevorzugt solche, die bei gleicher Lange, eine Sequenzidentitat 

35 zu der bevorzugten Erkennungssequenz (beispielsweise ihrer natur- 
lichen Erkennungssequenz) der jeweiligen Rekombinase von weniger 
als 90 %, bevorzugt weniger als 50 %, besonders bevorzugt weniger 
als 30 % aufweisen. 

40 Allgemein bevorzugt sind Rekombinasen, die alleine eine nahezu 
irreversible Integration katalysieren. Bevorzugt stammen diese 
aus Organismen, die normalerweise bei Temperaturen zwischen 
10 und 45°C leben. Auch wenn die meisten bekannten Rekombinasen 
aus Prokaryoten, Bakteriophagen bzw. Viren isoliert wurden, 

45 ist die Erfindung nicht auf diese beschrankt, sondern kann auch 
Rekombinasen aus eukaryotischen Organismen vorteiihaft einsetzen. 
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Die im Rahmen dieser Erf indung genutzte sequenzspezif ische 
Recombination ist nicht auf einen bestimmten Mechanismus limi- 
tiert. In der Regel erfolgt die Rekombination jedoch in zwei 
Schritten: Einem sequenzspezif ischen Schnitt der Erkennungs- 
5 sequenz gefolgt von einer Wiederverknupf ung , wobei meist ein 
kovalentes Protein-DNA Intermediat zwischen Zielsequenz und 
Rekombinase vorliegt. Fur manche Rekombinationen ist allein 
die Rekombinase als Protein erf orderlich. Andere konnen weitere 
Hilfsfaktoren bendtigen. Bevorzugt ist das benutzte Rekombi- 
10 nationssystem unabhangig von der Enzymausstattung des Empfanger- 
plastids. 

Besonders bevorzugt sind Rekombinasen, die zu den Familien der 
Integrasen oder der Resolvasen/Invertasen zahlen (Stark WM et al. 

15 (1992) Trends Genet 8:432-439). Integrasen (Tyrosin-Rekombinasen) 
haben ein Tyrosin im aktiven Zentrum, welches als Nucleophil 
im Spaltungsschritt fungiert und in der Bildung einer 3'Phospho- 
tyrosylbindung mit der DNA involviert ist. Die Reaktion erfolgt 
uber ein "Holliday Intermediat". Resolvasen/Invertasen (Serin- 

20 Rekombinasen) haben ein Serin im aktiven Zentrum, welches als 
Nucleophil im Spaltungsschritt fungiert und in der Bildung einer 
5 ' Phosphoserinylbindung mit der DNA involviert ist. Die Reaktion 
erfolgt nicht uber ein "Holliday Intermediat". 

25 Die Familie der Integrasen (auch Tyrosin-Rekombinasen genannt) 
umfassen beispielhaft die Cre Rekombinase aus dem Bakteriophagen 
PI, die FLP Rekombinase aus Hefe, die A,-Integrase des Phagen 
Lamda sowie die R Rekombinase des pSRl Plasmid der Hefe 
Zygosaccharomyces rouxii (Araki et al. (1985) J Mol Biol. 

30 182:191-203) und die h Rekombinase (Argos, et al. (1986) EMBO J 
5:433-440, 1986; Sadowski PD (1995) Progress Nucl Acid Res Mol 
Biol 51:53-91). 

Die X,-Integrase benotigt in der Regel weitere Faktoren, die an 
35 Sequenzen benachbart zu unmittelbaren Erkennungssequenz binden. 
Neben der Rekombinase (auch Int fur Integrase bezeichnet) wird 
noch IHF ("integration host factor") benotigt. Fur die Umkehr- 
reaktion, das Ausschneiden, ist zusatzlich noch der Faktor xis 
erf orderlich. 

40 

Die Familie der Resolvasen/Invertasen umfasst beispielhaft die 
<&C31 Rekombinase, R4 Rekombinase (GenBank Acc.-No.: D38173 
Nukleotide 292 bis 1701) , das Hin Inversionssystem aus Salmonella 
typhimurium und die TP901-1 Rekombinase (Hallet und Sherratt 
45 (1997) FEMS Microbiol Rev 21:157-178). Weitere Familienmitglieder 
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umfassen die Invertasen Gin des Mu Phagen, Cin des Bakteriophagen 
p und Pin des el4 Phagen. 

Im Unterschied zu der Integrase-Familie haben die Mitglieder 
5 der Resolvasen in der Regel eine konservierte N-terminale kata- 
lytische Domaine (Crellin und Rood (1997) J Bacteriology 15 
179(16) :5148-5156; Christiansen et al. (1996) J Bacteriology 
178(17) : 5164-58173) . Wie einige der Cre-typ Rekombinasen sind 
manche Resolvasen unabhangig von Faktoren des Wirtes (Thorpe und 

10 Smith (1998) PNAS USA 95:5505-5510). Die Resolvasen /Invertasen 
nutzen einen anderen Reaktionsmechanismus als die Integrasen 
(Gopaul DN und van Duyne GD (1999) Curr Opin Structural Biol 
9:14-20; Jayaram M (1994) TIBS 19:78-83). Besonders bevorzugt ist 
die Untergruppe der "Extended Resolvases" (Brondsted L und Hammer 

15 K (1999) Appl Environm Microbiol 65: 752-758). Diese haben eine 
Homologie zu den anderen Resolvasen/ Invertasen, weisen aber im 
Vergleich zu diesen eine Extension am C-Terminus auf . Der Vor- 
teil dieser Rekombinasen liegt darin, dass sie wenig bis keine 
Helferfaktoren fur die Katalyse der Rekombination zwischen zwei 

20 Erkennungsregionen benotigen (Brondsted L und Hammer K (1999) 
Appl Environm Microbiol 65:752-758). Fur die effiziente Katalyse 
der Umkehrreaktion hingegen werden weitere Faktoren benotigt. 
Durch Expression der entsprechenden Rekombinase alleine kann man 
daher bei geeigneter Positionierung der Erkennungssequenzen eine 

25 unter diesen Bedingungen nahezu irreversible Integration einer 
heterologen DNA-Seguenz bewirken. Besonders bevorzugt aus dieser 
Untergruppe sind die Rekombinasen der Phagen TP901-1 und *C31. 

Bevorzugt werden die Rekombinasen der Integrase-Familie genutzt, 
30 weil sie natiirlicherweise in der Regel intermolekulare Rekombi- 
nationen vermitteln. 

Besonders bevorzugt werden in der vorliegenden Erfindung Rekombi- 
nasen eingesetzt, die zwei unterschiedliche Erkennunsregionen 
35 rekombinieren und die bei der Rekombination entstehenden hybriden 
Erkennungsregion von der Rekombinase nicht mehr effizient oder 
nur mit einem weiteren Faktor erkannt und genutzt werden. 

Wahrend bei den Rekombinationsereignissen der homologen Rekombi- 
40 nation (z.B. Doppel-Crossovers) extensive Sequenzhomologie 
benotigt wird, vermittelt die Erkennungsseguenz-spezif ische 
Rekombination DNA-Umordnungen zwischen Segmenten, die keine 
extensive Homologie aufweisen. Die Rekombinationsereignisse 
treten bei der Erkennungssequenz-spezif ischen Rekombination aus- 
45 schlieSlich an spezif ischen Stellen der DNA auf (Craig NL (1988) 
Annu Rev Genet 22:77-105). 
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Rekombinationssysteme wie die X. Integrase aus dem X-Phagen, die 
Rekombinase aus dem Mycobakteriophagen L5 (Pena CEA et al. (2000) 
Proc Natl Acad Sci USA 97:7760-7765; Lee MH et al. (1991) Proc 
Natl Acad Sci USA 88:3111-3115), die Rekombinase aus dem Phagen 
5 4>C31 (Kuhstoss S und Rao RN (1991) J Mol Biol 222: 897-908; Groth 
AC et al. (2000) Proc Natl Acad Sci USA 97: 5995- 6000; Rausch H 
und Lehmann M (1991) Nucl Acids Res. 19: 5187- 5189; Thorpe HM 
und Smith MCM (1998) Proc Natl Acad Sci USA 95: 5505-5510; 
Kuhstoss S. et al. (1991) Gene 102:145-146; Harris JE et al. 

10 (1983) Gene 22:167-174) oder die Rekombinase aus dem Phagen 

TP901-1 (Brondsted L und Hammer K (1999) Appl Environm Microbiol 
65:752-758; Bruener A et al. (1999) J Bacterid 181: 7291- 7297; 
Koch B et al. (1997) Appl Environm Microbiol 63: 2439-2441, 
Christiansen B et al. (1996) J Bacterid 178:5164-5173) nutzen 

15 naturlicherweise fur ein Rekombinationsereignis zwei in ihrer 
Seguenz unterschiedliche Erkennungsregionen, in der Regel attP 
und attB genannt. Diese werden zu neuen, hybriden Erkennungs- 
regionen (attR und attL) rekombiniert, die nicht von der ent- 
sprechenden Rekombinase allein effizient genutzt werden. Erst 

20 wenn ein oder mehrere weitere Faktoren hinzu kommen, werden diese 
Erkennungsregionen wieder erkannt und eine Rekombination (Rttck- 
reaktion) zwischen diesen kann erfolgen. Eine Vielzahl von Fak- 
toren, die fur die katalytische Wirkung der X-Rekombinase eine 
Rolle spielen, sind bekannt (Landy A (1993) Curr Opin Gen Develop 

25 3:699-707). Als weitere, bevorzugt verwendete Rekombinasen seien 
zu nennen: xisF aus Anabaena (Ramaswamy KS et al. (1997) Mol 
Microbiol 23:1241-1249; Carrasco CD et al. (1994) Genes Develop 
8:74-83), Integrase vom Phagen *LC 3 (Lillehaug D (1997) Gene 
188:129-136), Rekombinase kodiert vom sre Gen des R4-Phagen 

30 (Matsuura M et al. (1996) J Bacteriol 178:3374-3376). 

Neben den bevorzugt genutzten Rekombinasesystemen, die allein 
naturlicherweise eine irreversible Reaktion vermitteln, sind auch 
die bekannten Rekombinase Systeme wie Cre/lox; FLP/frt aus der 

35 Hefe; R-RS aus Zygosaccharomyces rouxii (Onouchi, H et al., 1991, 
Nucl. Acids Res. 19: 6373-6378) oder Gin-gix aus dem Bakterio- 
phagen Mu (Maeser S und Kahraann R (1991) Mol Gen Genet 
230:170-176) im Rahmen dieser Erfindung nutzbar. Diese Systeme 
vermitteln naturlicherweise eine reversible Rekombination, wobei 

40 das Gleichgewicht meist auf die Seite der Excision verschoben 
ist. Fur die Anwendung im Rahmen dieser Erfindung werden diese 
Systeme bevorzugt nahezu irreversibel gemacht (siehe unten) . 

Ganz besonders bevorzugt werden die Rekombinasen aus <I>C31 und 
45 TP901-1 genutzt. Am meisten bevorzugt sind die Rekombinasen mit 
Nukleinsaureseguenzen hinterlegt unter den GenBank Acc.-No Y14232 
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(TP901-1; komplementar bp 30 bis 1487) bzw. X59938 (<DC31; Nukleo- 
tide 232 bis 2073) . 

Es sind verschiedene Verfahren denkbar, urn eine Rekombinase in 
5 Plastiden einzubringen oder dort zu exprimieren. Beispielhaft 
jedoch nicht einschrankend sind zu nennen: 

a) Nukleare Expression unter Verwendung plastidarer Transit- 
peptide 

10 

Eine Expressionskassette kodierend fur eine Rekombinase kann 
in der dem Fachmann bekannten Weise konstruiert, in den Zell- 
kern eingeftihrt und - optional - stabil in die chromosomale 
DNA integriert werden. Die Expression erfolgt dann transient 

15 oder - bei Integration in die chromosomale DNA - stabil. Fur 

einen Transport in die Plastiden wird die Rekombinase bevor- 
zugt in Fusion mit einer Plastidenlokalisationsseguenz (PLS) 
exprimiert. Verfahren, an sich nicht in den Plastiden lokali- 
sierte Proteine, gezielt in die Plastiden zu transport ieren 

20 sowie verschiedene PLS-Sequenzen sind beschrieben (Klosgen RB 

und Weil JH (1991) Mol Gen Genet 225 (2) :297-304; Van Breuse- 
gem F et al. (1998) Plant Mol Biol 38 (3 ): 491-496) . Bevorzugt 
sind PLS, welche nach Translokation der Rekombinase in die 
Plastiden vom Rekombinase-Teil enzymatisch abgespalten 

25 werden. Insbesondere bevorzugt ist die PLS, die von der 
plastidaren Nicotiana tabacum Transketolase oder einem 
anderen Transitpeptid (z.B. dem Transitpeptid der kleinen 
Untereinheit der Rubisco oder der Ferredoxin NADP Oxido- 
reduktase als auch der Isopentenylpyrophosphat Isomerase-2) 

30 Oder dessen funktionellem Equivalent abgeleitet ist. Far die 

nukleare Expression sind im Prinzip alle Promotoren geeignet, 
die eine Expression in Pflanzen ermSglichen. Beispiele sind 
weiter unten gegeben. Bevorzugt sind konstitutive Promotoren 
wie der 35S Promotor des CaMV oder der Nitrilase-1 Promotor 

35 des nitl Gens aus Arabidopsis (GenBank Acc.-No.: Y07648.2, 

Nukleotide 2456 bis 4340; Hillebrand H et al. (1998) Plant 
Mol Biol 36 (l):89-99; Hillebrand H et al. (1996) Gene 
170(2) :197-200) . 

40 Bevorzugte PLS Sequenzen sind: 

i) das Transitpeptid der Isopentenylisomerase (IPP) aus 
Arabidopsis (GenBank Acc.-No. : NC_003074; Nukleotide 
604657 - 604486) 

45 



5 
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ii) Transitpeptide abgeleitet von der kleine Untereinheit 
(SSU) der Ribulosebisphosphatcarboxylase (Rubisco ssu) 
aus beispielsweise Erbse, Mais, Sonnenblume oder Arabi- 
dopsis . 

Arabidopsis thaliana: GenBank Acc.-No.: z.B. 
AY054581, AY054552; 

Erbse, GenBank Ac c . -No . : z.B. X00806, Nukleotide 1086 
bis 1256; X04334, X04333 {Hand JM (1989) EMBO J 
8 <11) : 3195-206) . Hier besonders bevorzugt: Expres- 
sionskassette und Transitpeptid (Erbse, rbcS3A) aus 
Vektor pJIT117 (Guerineau F (1988) Nucleic Acids Res 
16 (23) :11380. Besonders bevorzugt ist die Peptidse- 
quenz gemafi SEQ ID NO: 11. Am meisten bevorzugt fur 
die Verwendung zur Konstruktion von entsprechenden 
Expressionskonstrukten ist die Nukleinsauresequenz 
gemaS SEQ ID NO: 10. 

Mais, GenBank Ac c . -No . : z.B. S42568, S42508 

Sonnenblume, GenBank Acc . -No . : Y00431, Nukleotide 301 
bis 465. 

iii) Transitpeptide abgeleitet von Genen der pflanzlichen 
Fettbiosynthese wie das Transitpeptid des plastidaren 
"Acyl Carrier Protein" (ACP) (z.B. die Arabidopsis 
thaliana beta-ketoacyl-ACP synthetase 2; GenBank Acc.- 
No.: AF318307), die Stearyl-ACP-Desaturase, p-Ketoacyl- 
ACP Synthase oder die Acyl-ACP-Thioesterase (z.B. 
A. thaliana mRNA for acyl- (acyl carrier protein) thio- 
esterase: GenBank Acc . -No . : Z36911) . 

iv) das Transitpeptid der GBSSI ("Starch Granule Bound 
Synthase I") 

v) das Transitpeptid der LHCP II Gene. 

Besonders bevorzugt ist die plastidare Transketolase aus 
Tabak (SEQ ID NO: 12). Zur Expression entsprechender Fusions- 
proteine kSnnen im Rahmen dieser Erf indung verschiedene 
PLS-Nukleinsaurekassetten in den drei Leserastern als 
Kpnl/BamHI Fragment verwendet werden (der Translationsstart 
(ATG-Kodon) ist in der Ncol Schnittstelle lokalisiert) (pTP09 
SEQ ID NO: 13; pTPIO SEQ ID NO: 14; pTPll SEQ ID NO: 15) . 
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Ein weiteres Beispiel fur eine vorteilhaft einzusetzende PLS 
ist das Transitpeptid der plastidaren Isopentenylpyrophosphat 
Isomerase-2 (IPP-2) aus Arabidopsis thaliana (SEQ ID NO: 16) . 
Ganz besonders bevorzugt konnen die Nukleinsauresequenzen 
5 kodierend fiir drei Kassetten (entsprechend den drei Lese- 

rastern) der PLS der Isopentenylpyrophosphat Isomerase-2 
(IPP-2) aus Arabidopsis thaliana verwendet werden (EcoRV/ 
Sall-Kassetten mit ATG; IPP-9 SEQ ID NO: 17; IPP-10 
SEQ ID NO: 18; IPP-11 SEQ ID NO: 19). 

10 

Die erfindungsgemaSen Nukleinsauren kSnnen synthetisch her- 
gestellt oder natiirlich gewonnen sein oder eine Mischung aus 
synthetischen und naturlichen Nukleinsaure-Bestandteilen ent- 
halten, sowie aus verschiedenen heterologen Genabschnitten 
15 verschiedener Organismen bestehen. 

Die fiir das Transitpeptid kodierende Sequenz kann ganz oder 
teilweise die Peptidsequenz des Ursprungsproteins umfassen. 
Eine exakte Bestimmung der fiir den Transport essentiellen 
20 Aminosaurereste ist nicht erf orderlich, solange die Funktio- 

nalitat der PLS - namlich der Transport in die Plastiden - 
gewahrleistet ist, und die Funktion der Rekombinase nicht 
ganzlich zerstort wird. Ganz besonders bevorzugt sind die 
nachfolgenden PLS-Seguenzen: 

25 

PLS1 : N-MASSSSLTLSQAILSRSVPRHGSASSSQLSPSSLTFSGLKSNPNITTSRRR 
TPSSAAAAAWRSPAIRASAATETIEKTETAGS-C (SEQ ID NO: 12) . 
Entspricht der PLS der plastidaren Transketolase aus 
Tabak. 

30 

PLS2 : N-MSAS SLFNLPLIRLRSLALS SSFSSFRFAHRPLSS I S PRKL PNFRAFSGTA 
MTDTKDGSRVDM-C (SEQ ID NO: 16) . Entspricht der PLS 
der Isopentenylpyrophosphat Isomerase-2 (IPP-2), 
wobei das letzte Methionin bevorzugt das Start- 
35 Methionin der Rekombinase ist. 

Fusionsproteine aus PLS und Rekombinase sind im Rahmen dieser 
Erfindung unter dem Begriff der Rekombinase subsumiert. 
Wird eine Rekombinase nuklear exprimiert, so wird unter der 
40 Rekombinase bevorzugt ein Fusionsprotein aus PLS und der 

Rekombinase verstanden. 

b) Expression in Plastiden 

45 Eine Expression in Plastiden kann auch durch direkte Ein- 

fuhrung einer Expressionskassette fiir die Rekombinase in 
Plastiden, ggf . Integration in die plastidare .DNA und 
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Expression der Rekombinase erfolgen. In einer bevorzugten 
Ausfiihrungsform ist diese Expressionskassette in dent die 
Insertionssequenz umfassenden Trans formationskonstrukt 
enthalten. Die Expression kann aber auch von einer separaten 
5 Expressionskassette aus realisiert werden. 

Dabei konnen zum einen spezifische Plastiden- oder Chromo- 
plasten-Promotoren - wie unten im Detail beschrieben - zum 
Einsatz kommen. Eine gezielte plastidSre Expression kann 
auch erreicht werden, wenn man zum Beispiel einen viralen, 
bakteriellen oder Bakteriophagen Promotor verwendet, die 
resultierende Expressionskassette in die plastidare DNA ein- 
bringt und die Expression dann durch die korrespondierende 
virale, bakterielle oder Bakteriophagen RNA- Polymerase indu- 
ziert. Die korrespondierende RNA-Polymerase kann wiederum auf 
verschiedene Art und Weise - bevorzugt durch nukleare Trans- 
formation als Fusionsprotein mit einer PLS - in die Plastiden 
eingebracht werden. Entsprechende Verfahren sind beschrieben 
(WO 95/16783, WO 97/06250, US 5,925,806). Das Einbringen in 
Plastiden wird bevorzugt mittels Mikroinjektion und besonders 
bevorzugt mittels Partikelbeschuss durchgefuhrt. 

c) Einbringen als RNA 

Die Rekombinase kann auch durch Einfuhrung der fur die 
Rekombinase kodierenden - beispielsweise in vitro erzeugten - 
mRNA z.B. uber Mikroinjektion, Partikel-Bombardierung (bio- 
listische Verfahren) , Polyethylenglykol- oder Liposomen-ver- 
mittelte Transfektion in Plastiden eingebracht werden. Diese 
Aus fuhrungs form ist vorteilhaft, da hier keine die Rekombi- 
nase kodierenden Sequenzen im Plastom oder Genom verbleiben. 
Bevorzugt wird die die Rekombinase kodierende RNA durch in 
vitro Transkription in einer dem Fachmann bekannten Weise 
hergestellt. 

d) Einbringen als Protein 

Die Rekombinase kann direkt beispielsweise iiber Mikro- 
injektion, Partikel-Bombardierung (biolistische Verfahren) , 
Polyethylenglykol-Transfektion oder Liposomen-vermittelte 
Transfektion in Plastiden eingebracht werden. Diese 
Ausfiihrungsform ist vorteilhaft, da hier keine die Rekombi- 
nase kodierenden Sequenzen im Plastom oder Genom verbleiben. 
Ein entsprechendes Verfahren ist beispielsweise beschrieben 
bei Segal DJ et al. (1995) Proc Natl Acad Sci USA 92:806-810. 
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Die Rekombinase kann alternativ als Fusionsprotein mit 
dem VirE2 oder VirF Protein eines Agrobakterium sowie einer 
PLS in Pf lanzenzellen eingeschleust werden. Entsprechende 
Verfahren sind beispielsweise fur die Cre-Rekombinase 
5 beschrieben (Vergunst AC et al. (2000) Science 290:979-982). 

Diese Ausfuhrungsform ist vorteilhaft, da hier keine die 
Rekombinase kodierenden Sequenzen im Genom verbleiben. 

Natiirlich sind auch Kombinationen der oben beschriebenen MSglich- 
10 keiten denkbar. 

Bevorzugt ist die Expressionskassette fur die Rekombinase auf der 
Insertionssequenz oder dem Transformationskonstrukt enthalten. Es 
k6nnen auch Masterpf lanzen erzeugt werden, die eine Expressions- 
15 kassette far eine Rekombinase stabil in die plastidare DNA oder 
die nukleare DNA integriert umfassen. 

Bevorzugt ist die Rekombinase im Moment des Einbringen des Trans - 
formationskonstruktes bzw. der Insertionssequenz in den Plastiden 
20 der Masterpf lanze funktionell vorhanden. 

Besonders bevorzugt wird die Rekombinase gleichzeitig mit oder 
nach der Einfuhrung der Insertionssequenz in die Plastiden 
eingebracht bzw. aktiviert. Die Expression bzw. Aktivierung am 
25 richtigen Ort und zur richtigen Zeit kann durch verschiedene 
Ansatze sichergestellt werden: 

a) Induzierbare Expression 

30 Die Expression einer Rekombinase kann unter Verwendung eines 

induzierbaren Promotor, bevorzugt eines chemisch induzier- 
baren Promotors, gesteuert werden. Dazu kann beispielsweise 
die fur die Rekombinase kodierende Expressionskassette stabil 
in die plastidare oder nukleare DNA einer Masterpf lanze 

35 transformiert werden. Erfolgt die Transformation in das 

Kerngenom, so muss - wie oben beschrieben - die subzellulare 
Lokalisation durch geeignete PLS-Transitpeptide sicher- 
gestellt werden. Kurz vor oder wahrend der Transformation 
mit der Insertionssequenz oder dem Transformationskonstrukt 

40 wird dann in Abhangigkeit von dem gewahlten induzierbaren 

System die Expression der Rekombinase durch Applikation des 
entsprechenden Induktors eingeschaltet . Dem Fachmann sind 
verschiedene Verfahren oder Promotoren zur induzierten 
Expression bekannt. Als Stimulus konnen chemische Substanzen 

45 oder auch physikalische Stimuli wie beispielsweise erhohte 
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Temperatur oder Verwundung etc. fungieren. Verschiedene 
Beispiele sind weiter unten beschrieben. 



b) Induzierbare Aktivitat 

5 

Die Rekombinase kann bereits in den Plastiden der Master- 
pflanze vorliegen, wenn die Aktivitat durch geeignete 
Techniken erst zum gewahlten Zeitpunkt etwa durch Zugabe 
chemischer Substanzen induziert wird. Entsprechende Verfahren 

10 sind fur sequenzspezif ische Rekombinasen beschrieben (Angrand 

PO et al. (1998) Nucl Acids Res 26 (13) :3263-3269; Logie C und 
Stewart AF (1995) Proc Natl Acad Sci USA 92 (13 ) :5940-5944; 
Imai T et al. (2001) Proc Natl Acad Sci USA 98 (1) : 224-228) . 
Bei diesen Verfahren werden Fusionsproteine aus der Rekombi- 

15 nase und der Ligandenbindedomane eines Steroidhormonrezeptors 

(z.B. des humanen Androgenrezeptors, oder mutierte Varianten 
des humanen Estrogenrezeptors wie dort beschrieben) ein- 
gesetzt. Die Induktion kann mit Liganden wie beispielsweise 
Estradiol, Dexamethason, 4-Hydroxytamoxifen oder Raloxifen 

20 erfolgen. 

Die meisten Rekombinasen sind als Multimer (oft als Tetramer) 
aktiv (Stark et al., 1992, TIG 8: 432-439). Es ist denkbar, 
die Multimerisierung induzierbar zu gestaltet, indem bei- 

25 spielsweise die naturlichen Multimerisierungsdomanen gegen 

die Bindungsdomane eines niedermolekularen Liganden aus- 
getauscht werden. Zugabe eines dimeren Liganden bewirkt dann 
Dimerisierung des Fusionsproteins. Entsprechende induzierbare 
Dimerisierungsverfahren als auch die Herstellung der dimeren 

30 Liganden sind beschrieben (Amara JF et al. (1997) Proc Natl 

Acad Sci USA 94(20): 10618-1623; Muthuswamy SK et al. (1999) 
Mol Cell Biol 19(10): 6845-6857; Schultz LW und Clardy J 
(1998) Bioorg Med Chem Lett 8{l):l-6; Keenan T et al . (1998) 
Bioorg Med Chem. 6 (8) : 1309-1335) . 

35 

c) Cotransfektion 

Bevorzugt wird die Expressionskassette kodierend fur die 
Rekombinase gleichzeitig mit der Insertionssequenz in die 

40 Plastiden eingebracht. Dabei kSnnen die Expressionskassette 

far die Rekombinase und die Insertionssequenz auf einem DNA- 
Molekul oder auf zwei getrennten vorliegen. Bevorzugt liegen 
die beiden Sequenzen auf einem DNA-Molekttl zusammen vor, so 
dass die Expressionskassette in dem die Insertionssequenz 

45 umfassenden Transf ormationskonstrukt enthalten ist. 
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Dabei wird in einer besonders bevorzugten Ausfuhrungsf orm, 
nachdem homoplastome Pflanzen regeneriert wurden, die Sequenz 
kodierend ftir die Rekombinase aus dem Plastom wieder ent- 
fernt. Dem Fachmann sind dazu verschiedene Verfahren bekannt, 
5 die weiter unten im Detail beschrieben sind. 

Ein weiterer Gegenstand der Erfindung betrif ft Fusionsproteine 
von Rekombinasen der Familie der Resolvasen/Invertasen mit 
Plastidlokalisationsseguenzen, sowie die fur diese kodierenden 

10 Nukleinsauresequenzen. Umfasst sind ferner Expressionskassetten, 
die besagte Nukleinsauresequenzen unter Kontrolle eines im 
pflanzlichen Zellkern funktionellen Promotors enthalten. Ent- 
sprechende Promotoren sind dem Fachmann bekannt und weiter unten 
beschrieben. Bevorzugte Resolvasen/Invertasen sind die <DC31 

15 Rekombinase, die R4 Rekombinase, das Hin Inversionssystem aus 
Salmonella typhimurium und die TP901-1 Rekombinase, sowie die 
Rekombinasen Gin des Mu Phagen, Cin des Bakteriophagen P und 
Pin des el4 Phagen. Ganz besonders bevorzugt sind die <DC31 
Rekombinase und die TP901-1 Rekombinase. Am meisten bevorzugt 

20 sind die Proteine gemaS SEQ ID NO: 41, 42, 46, 47 und 61. Als 
Expressionskassetten bevorzugt sind insbesondere die Sequenzen 
gemafi SEQ ID NO: 40 und 45. Die angegebene Sequenz der TP901-1 
Rekombinase gemaS SEQ ID NO: 46 und 47 enthalt im Vergleich zu 
der in der GenBank hinterlegten (SEQ ID NO: 61) einen Aminosaure- 

25 austausch. 

Ein weiterer Gegenstand der Erfindung betrif ft Expressions- 
kassetten, die Nukleinsauresequenzen kodierend fur Rekombinasen 
der Familie der Resolvasen/Invertasen unter Kontrolle eines in 

30 pflanzlichen Plastiden funktionellen Promotors enthalten. Ent- 
sprechende Promotoren sind dem Fachmann bekannt und weiter unten 
beschrieben. Bevorzugte Resolvasen/Invertasen sind die <E>C31 
Rekombinase, die R4 Rekombinase, das Hin Inversionssystem aus 
Salmonella typhimurium und die TP901-1 Rekombinase, sowie die 

35 Rekombinasen Gin des Mu Phagen, Cin des Bakteriophagen P und Pin 
des el4 Phagen. Ganz besonders bevorzugt sind die *C31 Rekombi- 
nase und die TP901-1 Rekombinase. 

"Rekombinase-Erkennungssequenz" (infolge "RE-Sequenz" ) meint 
40 allgemein solche Sequenzen, die unter den Bedingungen in den 

Plastiden der jeweils verwendeten pflanzlichen Zelle oder Pflanze 
die Erkennung und nachfolgende Verwendung als Rekombinations- 
substrat durch eine Rekombinase erlauben. 

45 Bevorzugt ist die Geschwindigkeit einer Rekombinationsreaktion 
einer bestimmten Rekombinase unter Einsatz einer RE-Sequenz (bei- 
spielsweise ihrer naturlichen Erkennungssequenz) mindestens zehn- 
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fach so hoch wie fur den Einsatz einer beliebigen anderen nicht- 
homologen Sequenz, bevorzugt mindestens hundertfach so hoch, be- 
sonders bevorzugt mindestens eintausendfach so hoch, am meistens 
bevorzugt mindestens zehntausendfach so hoch. Dabei meint eine 
5 "nicht-homologe Sequenz" bevorzugt solche, die bei gleicher 

Lange, eine Sequenzidentitat zu der bevorzugten Erkennungssequenz 
(beispielsweise ihrer nattirlichen Erkennungssequenz) der jeweili- 
gen Rekombinase von weniger als 90 %, bevorzugt weniger als 50 %, 
besonders bevorzugt weniger als 30 % aufweisen. 

10 

Besonders bevorzugt sind RE-Sequenzen der oben beschriebenen 
sequenzspezifischen Rekombinasen. Bevorzugt ist die RE-Sequenz 
einer bestimmten Rekombinase singular in der plastidaren DNA, 
d.h. eine Rekombination wird nur an der so vordef inierten Stelle 

IS erzeugt. Es sind jedoch auch Falle denkbar, bei denen mehr als 
eine RE-Sequenz im Plastom vorhanden ist. Dies ist insbesondere 
der Fall, wenn die RE-Sequenz in duplizierten Genen (z.B. in 
invertierten "Repeats") lokalisiert ist. Im letzteren Fall liegen 
mehr als eine identische RE-Sequenz vor, ihr Kontext ist jedoch 

20 identisch, so dass auch hier eine gezielte Insertion erfolgt. Es 
ist sogar bevorzugt, dass die Integration in alle Kopien erfolgt, 
so dass auch eine Insertion in alien Kopien erforderlich ist. RE- 
Sequenzen, die zwar mehr als einmal in einem Plastom auftreten, 
jedoch im gleichen plastomen Kontext lokalisiert sind (z.B. in 

25 "Repeats" oder Genduplikationen) sind Im Rahmen dieser Erfindung 
unter dem Begriff der singularen RE-Sequenzen subsumiert. Natiir- 
lich konnen singulare RE-Sequenzen unterschiedlicher Rekombinasen 
parallel in einem Plastom vorliegen. 

30 Anstelle der natiirlichen RE-Sequenzen der genutzten Rekombinasen 
kSnnen auch modifizierte Erkennungsregionen genutzt werden, wie 
sie zum Beispiel fur die FLP oder Cre Rekombinase beschrieben 
wurden {Senecoff JF und Cox MM (1986) J Biol Chem 261:7380-7386; 
Albert H et al. (1995) Plant J 7:649-659). Bevorzugt werden 

35 jedoch die natiirlichen Sequenzen im Rahmen dieser Erfindung 

genutzt. Daruber hinaus kSnnen die Rekombinasen selbst durch eine 
Mutagenese verbessert werden, wie es etwa fur die FLP Rekombinase 
gezeigt wurde (Buchholz F et al. (1998) Nature Biotech 
16:657-662) . 

40 

Es ist auch denkbar, zwei nicht miteinander rekombinierende RE- 
Sequenzen (die von ein und der selben oder verschiedenen Rekombi- 
nasen erkannt werden) flankierend zu einem zu integrierenden DNA- 
Segment zu nutzen. Diese konnen bevorzugt mit jeweils kompatiblen 
45 Erkennungsregionen in einem anderen Molekul rekombiniert werden 
(Hoess RH et al. (1986) Nucl Acids Res 14: 2287-2300). 
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Grundsatzlich kann zwischen "wildtyp" RE-Sequenzen und "pseudo" 
RE-Sequenzen unterschieden werden. Dabei meint "wildtyp" RE- 
Seguenz solche Sequenzen, wie sie im naturlichen System von der 
Rekombinase genutzt werden. Beispielsweise die loxP Sequenz fur 
5 die ere Rekombinase oder die FRT Sequenz fur die FLP Rekombinase 
oder die GIX Sequenz fur die Gin Rekombinase. Diese Sequenzen 
konnen aus ihren homologen Ursprungssystemen (beispielsweise den 
naturlichen Phagen) abgeleitet und vorteilhaft im Rahmen dieser 
Erfindung eingesetzt werden. "Pseudo" RE-Sequenzen meint solche 

10 Sequenzen, die von einer Rekombinase erkannt und als Substrat far 
eine Rekombination genutzt werden kSnnen jedoch Sequenzen haben, 
die mit der "wildtyp" RE-Sequenz nicht identisch sind. Solche 
Sequenzen konnen beispielsweise aus heterologen Organismen iso- 
liert werden, oder mittels kttnstlicher Mutagenese erzeugt werden. 

15 Beispielsweise kdnnen manche Rekombinasen - wie beispielsweise 
4>C31 - in den Genomen mancher Eukaryoten Rekombinationen be- 
wirken, haben also auch hier funktionelle RE-Sequenzen, die 
Shnlich aber nicht identisch zu der "wildtyp" RE-Sequenz sind. 
"Pseudo" RE-Sequenzen konnen mittels Sequenzalignment, Sekundar- 

20 strukturvergleich. Deletions- oder Punktmutationsanalyse identi- 
fiziert werden. Dabei kommen vorteilhafterweise funktionelle 
Tests zum Einsatz, urn die Wirkung der Rekombinase auf die RE- 
Sequenzen zu bestimmen. Ferner umfasst sind hybride RE-Sequenzen, 
die sich aus Teilen einzelner RE-Sequenzen - beispielsweise - 

25 aus jeweils einem Anteil einer "wildtyp" RE-Sequenz und einer 
"pseudo" Re-Sequenz zusammensetzen . 

Die Rekombinase wird in die Plastiden vor, gleichzeitig und/oder 
nach Einfiihrung des Transformationskonstruktes eingebracht. 

30 

Bevorzugt ist die eingesetzte Pflanze oder von dieser abgeleitete 
Zelle beziiglich der RE-Sequenz iiberwiegend homoplastom oder homo- 
transplastom, d.h. dass die uberwiegende Anzahl der in einem 
Plastid enthaltenen plastidaren DNA-Molekiile diese RE-Sequenz 
35 aufweisen. Solche Pflanzen werden auch als Masterpflanzen im 
Rahmen dieser Erfindung bezeichnet. 

Prinzipiell konnen zwei Arten von RE-Sequenzen genutzt werden: 
40 a) Naturliche, endogene RE-Sequenz 

Eine naturlicherweise im Plastom vorkommende Sequenz kann als 
Erkennungssequenz fur beispielsweise eine chimare Rekombinase 
fungieren. Chimare Rekombinasen konnen beispielsweise durch 
45 Fusion einer die Sequenz besagter Erkennungsregion bindenden 

Zinkfingerdomane und eine katalytischen Domane einer Rekombi- 
nase bestehen (W0 96/06166). Wie solche Zinkf ingerdomanen 
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bzw. solche chimaren Rekombinasen erstellt werden, ist dem 
Fachmann bekannt (Beerli RR et al. (2000) Proc Natl Acad Sci 
USA 97(4) :1495-1500; Beerli RR et al.(2000) J Biol Chem 
275(42) :32617-32627; Segal DJ and Barbas CF 3rd. (2000) Curr 
5 Opin Chem Biol 4(l):34-39; Kang JS and Kim JS (2000) J Biol 

Chem 275(12) :8742-8748; Beerli RR et al. (1998) Proc Natl 
Acad Sci USA 95 (25 ): 14628-14633 ; Kim JS et al. (1997) Proc 
Natl Acad Sci USA 94 (8) : 3616-3620 ; Klug A (1999) J Mol Biol 
293 (2) :215-218; Tsai SY et al. (1998) Adv Drug Deliv Rev 

10 30(1-3) :23-31; Mapp AK et al. (2000) Proc Natl Acad Sci USA 

97(8) :3930-3935; Sharrocks AD et al. (1997) Int J Biochem 
Cell Biol 29(12):1371-1387; Zhang L et al. (2000) J Biol Chem 
275 (43) :33850-33860) . Verfahren zur Herstellung und Selektion 
von Zink-Finger DNA-Bindedomanen mit hoher Sequenzspezif itat 

15 sind beschrieben (WO 96/06166, WO 98/53059, WO 98/53057). 



Darviber hinaus ist es denkbar, bekannte Rekombinasen einer 
Mutagenese zu unterziehen, bis sie eine ausgewahlte Sequenz 
des Plastidengenoms einer betrachteten Pf lanzenspezies 
20 als Substrat erkennen. Pflanzen mit endogenen, naturlichen 

RE-Sequenzen stellen quasi natiirlich vorkommende "Master - 
pflanzen" dar. Bei ihnen ist die RE-Sequenz naturlicher- 
weise homoplastom vorhanden. Dies eriibrigt die Einfuhrung 
und Selektion kunstlicher RE-Sequenzen. 

25 

b) Kunstlich eingefiihrte RE-Sequenz 

Dem Fachmann ist bewusst, dass die in eine Masterpf lanze ein- 
gebrachte RE-Sequenz nicht natiirlich sein muss. Prinzipiell 

30 kann jede RE-Sequenz - beispielsweise eine natiirliche, 

mutierte oder pseudo RE-Sequenz - einer beliebigen Rekombi- 
nase an jede beliebige Stelle der plastidaren DNA insertiert 
werden. Die Herstellung erfolgt bevorzugt unter Verwendung 
eines Konstrukt zur Insertion der RE-Sequenz (infolge RE- 

35 Konstrukt). 

Bevorzugt umfasst das RE-Konstrukt einen Selektionsmarker , urn 
die zur Erzeugung entsprechender Masterpf lanzen erf orderliche 
Selektion transplastomer Pflanzen mit der erfolgreich inser- 

40 tierten RE-Sequenz zu erleichtern. Dem Fachmann sind ver- 

schiedene Selektionsmarker bekannt, die eine Selektion von 
Plastiden ermoglichen (s.u.). Bevorzugt sind aadA, nptll oder 
BADH, wobei aadA besonders bevorzugt ist. Die Selektion er- 
folgt beispielsweise mit Hilfe des dem Fachmann bekannten 

45 "segregation and sorting" Prozess (beispielhaf t unter Bei- 

spiel 4 beschrieben) . Der Selektionsmarker ist bevorzugt so 
konstruiert, dass eine nachfolgende Deletion aus dem Plastom 
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ermoglicht wird. Entsprechende Verfahren sind dem Fachmann 
bekannt und unten beschrieben. 

Das RE-Konstrukt kann neben dem Selektionsmarker weitere 
5 Sequenzen enthalten. Diese konnen beispielsweise weitere 

regulatorische Elemente far die Expression der infolge ein- 
zufiihrenden Insertionssequenzen enthalten. Der im Rahmen 
des Konstruktes zur Insertion der RE-Sequenz eingefiihrte 
Selektionsmarker wird in einer bevorzugten Ausfiihrungsf orm 
10 nach Erhalt der homoplastomen Masterpf lanze durch dem Fach- 

mann bekannte Verfahren deletiert (s.u.). 

Alternativ, kSnnen auch natiirliche, endogen am Insertionsort 
vorhandene regulatorische Elemente fur die Expression in 
15 Folge einzubringender Gene genutzt werden. 

In einer bevorzugten Ausfiihrungsf orm umfasst das RE-Konstrukt 
zur Ermoglichung einer ortsspezif ischen Insertion an min- 
destens einer, bevorzugt an beiden Seiten der RE-Sequenz 
20 weitere flankierende Sequenzen {A und B) , die eine aus- 

reichende Lange und Homologie zu entsprechenden Zielsequenzen 
im Plastom (A' und B') haben, urn eine ortsspezif ische Inser- 
tion mittels homologer Rekombination zu gewahrleisten. 

25 Nicht naturlicherweise in der plastidaren DNA vorkommende RE- 
Sequenzen konnen auf verschiedene Arten in die plastidare DNA 
eingefiihrt werden. Beispielhaft seien zu nennen: 

a) Integration mittels homologer Rekombination (z.B. Doppel- 
30 Crossover) 

Bevorzugt wird die Integration in das Plastidengenom mit 
Hilfe der oben beschriebenen, dem Fachmann allgemein bekann- 
ten Verfahren der homologen Rekombination (z.B. Doppel-Cross- 
35 over) durchgef uhrt . 

b) Integration unter Verwendung naturlicher oder endogener 
Erkennungssequenzen ftir ein Enzym geeignet zur Induktion von 
DNA-Doppelstrangbruchen (infolge DSB-Erkennungssequenz ; siehe 

40 unten) . 

c) Integration in Folge einer Rekombination mit Rekombinasen . 
Das erfindungsgemafie Verfahren selber kann genutzt werden, 
um beispielsweise weitere RE-Sequenzen zu integrieren. 

45 
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Es sind verschiedene Orte der Lokalisation bzw. Integration einer 
RE-Sequenz (bei bereits vorhandenen endogenen RE-Sequenzen) bzw. 
Integration (bei kiinstlich generierten RE-Sequenzen) fur die RE- 
Sequenz moglich. Beispielhaft seien zu nennen: 

5 

a) Lokalisation (Integration) in einer transkriptionell stillen 
Region 

Lokalisation (Integration) der RE-Sequenz in einer 
10 transkriptionell stillen Region des Plastidengenoms (inter- 

genische Region) ist die bevorzugte Ausfuhrungsform. Eine 
Storung der plastidaren Funktionen kann so weitgehend aus- 
geschlossen werden. Hierbei ist zu beachten, dass fiir eine 
Expression (z.B. von Selektionsmarkern oder anderen Genen 
15 von Interesse) gegebenenfalls entsprechende regulatorische 

Elemente wie Promotoren etc. mit eingebracht werden mussen. 

b) Lokalisation (Integration) in eine transkriptionell aktive, 
aber nicht-kodierende (intercistronische) Region 

20 

Diese Lokalisation (Integration) hat den Vorteil, dass da- 
durch die einzubringende Insertionssequenz letztendlich in 
einem plastidaren Operon kodiert ist und Promotor (en) bzw. 
Terminator (en) nicht gesondert mit eingebracht werden mussen, 
25 sondern die endogen an diesem Locus vorhandenen ausgenutzt 

werden kSnnen (aber nicht mussen) . Es sollten in einem 
solchen Fall lediglich Ribosomenbindestellen in geeignetem 
Abstand stromaufwarts der kodierenden Region der einzu- 
bringenden Fremd-Gene vorhanden sein. 

30 

Es ist jedoch auch denkbar, dass eine intergenische Region 
nicht vollstandig transkriptionell still ist, weil beispiels- 
weise eine nur inef fiziente Termination der Transkription von 
einem benachbarten Gen oder Operon erfolgt. 

35 

c) Lokalisation (Integration) in eine transkriptionell aktive, 
kodierende Regionen. 

Die unter a) und b) beschriebene Lokalisation (Integration) 
40 der RE-Sequenz an einem nicht kodierenden Locus, hat den 

Vorteil, dass die Insertion der Fremd-DNA die Funktion des 
Plastidengenoms mit hoher Wahrscheinlichkeit nicht beein- 
flusst. Nicht-kodierende Bereiche sind jedoch weniger konser- 
viert als kodierende. Um ein mSglichst universelles Verfahren 
45 zu haben, dass in vielen Pf lanzenarten f unktioniert , ist in 

einer besonders bevorzugten Ausfuhrungsform, die RE-Sequenz 
(und infolge die Insertionssequenz) in der kodierende Sequenz 
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eines bestehenden Gens lokalisiert. Die Zerstorung der 
Genfunktion durch die Einfuhrung der RE-Sequenz (bei einer 
kiinstlich generierten RE-Sequenz) oder durch die nachfolgende 
Einfuhrung der Insertionssequenz wird auf erf inderische Weise 
5 dadurch verhindert, dass die RE-Sequenz bzw. die Insertions- 

sequenz in einer bevorzugten Variante dieser Ausfuhrungsform 
im Rahmen eines Introns eingebracht wird. Auf diese Weise 
wird die vollstandige kodierende mRNA des Gens, in das die 
RE-Sequenz insertiert wurde, durch SpleiSen der pre-RNA 
10 wieder generiert. Alternativ kann die Insertion auch in ein 
nicht-essentielles plastidares Gen erfolgen. Auch kann das 
durch die Insertion der RE-Sequenz zerstSrte Gen in einer 
nachfolgenden Transformation wieder eingebracht werden. 

15 Das RE-Konstrukt hat bevorzugt - insbesondere wenn die Insertion 
in eine transkriptionell aktive oder gar translatierte Plastom- 
region erfolgt - die Struktur und Sequenz eines Introns. In der 
Regel werden dazu nattirlicherweise vorkommende Introns so modi- 
fiziert, dass sie den Erf ordernissen des erf indungsgemaSen Ver- 

20 fahrens geniigen. Bevorzugt erfolgt die Insertion derart, dass die 
insertierte Sequenz durch SpleiSen der pre-mRNA restlos entfernt 
wird. Die herausgespleiSte RNA (also das artifizielle Intron) 
stellt dann die mRNA beispielsweise fur die Translation auf ihr 
kodierter Proteine dar. Da die Transkription des Introns der 

25 regulatorischen Kontrolle des Gens, in das das Intron integriert 
wurde, unterliegt, kann man sich alle regulatorischen Elemente 
stromaufwarts bzw. stromabwarts der Gene oder des Gens von Inter- 
esse in dem Intron sparen. Dadurch kann man die Konstrukte ent- 
sprechend klein halten. Dariiber hinaus sind alle Introns nutz- ' 

30 bar, wenn man gleichzeitig die entsprechenden Faktoren, die das 
SpleiSen vermitteln, in den Plastiden exprimiert oder sie in 
diese importiert. Bevorzugt sind die das SpleiSen untersttitzenden 
Faktoren im Intron selbst kodiert. Besonders bevorzugt werden 
in dieser Ausfuhrungsform Introns der Gruppe II, die selbst 

35 wenigstens einen der fur das SpleiSen notwendigen Faktoren 

kodieren. Dazu gehSrt das Ll.ltrB Intron aus Lactococcus. Eben- 
falls bevorzugt sind Introns, die natiirlicherweise in Plastiden 
hSherer Pflanzen vorkommen, besonders Introns der Gruppe II, ganz 
besonders bevorzugt Introns, die fur ein Protein kodieren, am 

40 meisten bevorzugt Introns der trnK Gene des Plastidengenoms . Im 
letzteren Fall sind besonders bevorzugt die Introns aus den trnK 
Genen der Plastiden aus den Arten Arabidopsis, Mais und Tabak. 

Bevorzugt sind Introns mit einer selbst-spleiSenden AktivitSt, 
45 die nicht von weiteren Proteinfaktoren abhangt oder die all- 
gemeine Faktoren benutzen, die universell und damit auch in 
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Plastiden vorhanden sind. Zu diesen Introns gehfiren beispiels- 
weise 

a) das Intron der Gruppe I aus Tetahymena (GenBank Acc.-No.: 

5 X54512; Kruger K et al. (1982) Cell 31:147-157; Roman J und 

Woodson SA (1998) Proc Natl Acad Sci USA 95:2134-2139) 

b) das rll-lntron der Gruppe II aus Scenedesmus obliguus (Gen- 
Bank Acc.-No.: X17375.2 Nukleotide 28831 bis 29438; Hollander 

10 V und Kiick U (1999) Nucl Acids Res 27: 2339-2344; Herden- 

berger F et al. (1994) Nucl Acids Res 22: 2869-2875; Kiick U 
et al. (1990) Nucl Acids Res 18:2691-2697). 

c) das Ll.LtrB Intron (GenBank Acc.-No.: U50902 Nukleotide 2854 
15 bis 5345) 

d) das trnK-Intron aus Arabidopsis (GenBank Acc.-No.: AP000423 
Neukleotide komplementar 1752 bis 4310), Mais (GenBank Acc.- 
No.: X86563 Nukleotide komplementar 1421 bis 3909) oder Tabak 

20 (GenBank Acc.-No.: Z00044 Nukleotide komplementar 1752 bis 

4310) 

Sowohl artfremde als auch natiirlicherweise in den Plastiden der 
jeweiligen Pflanze vorkommende Introns k6nnen genutzt werden. Zur 

25 Vermeidung von durch Sequenzduplikation bedingte Instabilitaten 
sind artfremde Introns - beispielsweise artfremde trnK- Introns - 
bevorzugt. Natiirlicherweise in den Plastiden der jeweiligen 
Pflanze vorkommende Introns werden in einer bevorzugt en Aus- 
fiihrungsform so modifiziert, dass sie zwar ihre Funktion noch 

30 er fullen konnen, die Sequenzhomologie jedoch geringer als 95 %, 
bevorzugt 80 %, besonders bevorzugt 70 % zu der Seguenz des Aus- 
gangsintrons ist. 

Besonders bevorzugt sind Introns, die natarlicherweise ein DSB- 
35 Enzym ( insbesondere eine Homing Endonuklease kodieren) . Besonders 
bevorzugt ist das Intron Cp.LSU2 aus Chlamydomonas pallidostig- 
matica, welches das Enzym I-Cpal kodiert (Turmel Met al. (1995) 
Mol Biol Evol 12:533-545). Bevorzugt sind ferner die Introns der 
Gruppe II aus den Mitochondrien der Hefe. 

40 

In einer bevorzugten Ausfuhrungsf orm wird die Intronsequenz dem 
Insertionsort angepasst, so dass sie an diesem Lokus spleiSen 
kSnnen. Die Anpassung kann bei Gruppe I Introns die internal 
guide sequence (IGS) bzw. bei den Introns der Gruppe II die exon 
45 binding sequence (EBS) I oder /und II betreffen. 
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Im Fall des tmK Introns aus Mais konnte gezeigt werden, dass 
eine Editierung (His420Tyr) der entsprechenden mRNA in Plastiden 
der Gerste erfolgt (Vogel J et al. (1997) J Mol Biol 270:179- 
187). In einer bevorzugten Ausfuhrungsform wird daher das matK 
5 Gen im trnK-Intron aus Mais bereits durch einen entsprechenden 
His/Tyr-Austausch auf DNA-Ebene modifiziert, so dass eine RNA- 
Editierung nicht mehr erforderlich ist. 

Die SpleiSstelle wird im Fall von Gruppe I Introns bestimmt durch 
10 die Paarung der IGS mit dem 5' und/oder 3' zum Intron gelegenen 
Exon des entsprechenden Transkriptes (Lambowitz AM & Bel fort M 
(1993) Annu Rev Biochem 62:587-622) . Durch dem Fachmann bekannte 
Techniken wie PCR oder synthetisches Erstellen von Nukleotid- 
sequenzen kSnnen die IGS beliebiger Gruppe I Introns entsprechend 
15 so angepasst werden, dass ein SpleiEen an der vordef inierten 
Insertionsstelle innerhalb der DSB-Erkennungsregion erfolgt. 
Bevorzugt wird das Intron CpLSU2 aus C. pallidostigmatica 
genutzt, welches fur die Homing Endonuklease I-Cpal codiert. 
Bevorzugt wird ferner das Gruppe I Intron aus Tetrahymena thermo- 
20 phila (GenBank Acc.-No.: V01416 J01235; Nukleotide 53 bis 465). 
Die naturlicherweise zu findende IGS kann durch den Fachmann 
bekannte Techniken an die neue Insertionsstelle angepasst werden. 

Selbst-spleifiende Introns der Gruppe II besitzen eine konser- 
25 vierte Struktur und bestehen im allgemeinen aus 6 verschiedenen 
Domanen. Domane I beinhaltet die Exon-Bindestellen (EBS1 und 
EBS2 ) , die beim SpleiEvorgang eine Interaktion mit dem 5 ' vom 
Intron gelegenen Exon eingehen. Dariiber hinaus findet eine 
Interaktion zwischen der w 8 Region" und der "5' Region" am 3' 
30 Exon statt (Lambowitz AM & Belfort M (1993) Annu Rev Biochem 
62:587-622; Michel F & Ferat JL (1995) Annu Rev Biochem 
64:435-461). Diese Sequenzen konnen durch dem Fachmann bekannte 
Techniken wie synthetisches Erstellen der Introns oder geeignete 
PCR Methoden jeweils derart angepasst werden, dass eine korrekte 
35 Wahl der SpleiSstellen an dem in der DSB-Erkennungsregion gewahl- 
ten Insertionsort gewahrleistet ist. 

Selbstverstandlich konnen uber ein RE-Konstrukte auch gleich 
mehrere RE-Sequenzen fur bevorzugt unterschiedliche Rekombinasen 
40 eingebaut werden. Das RE-Konstrukt wird dabei bevorzugt in der 
Art und Weise erstellt, dass nach der Integration in das Plastom 
keine Sequenzen dupliziert vorliegen (keine Homologien zu nativen 
Sequenzbereichen) . 

45 Bevorzugt wird so zunachst eine bezuglich der insertierten RE- 
Sequenz uberwiegend homotransplastome Pflanze erzeugt, die eine 
RE-Sequenz in alien oder der uberwiegenden Anzahl der Plastiden 
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der betrachteten Pflanze besitzen. Solche Pflanzen k5nnen vor- 
teilhaft als Masterpf lanzen eingesetzt werden. Auch wenn der Auf- 
wand zur Insertion einer kiinstlichen RE-Sequenz in die plastidare 
DNA relativ hoch ist und im Fall der Insertion mittels homologer 
5 Rekombination (z.B. Crossover) dem der zur Zeit im Stand der 
Technik beschriebenen Verfahren zur Plastidentrans formation 
entspricht, so muss dieser Aufwand lediglich einmalig betrieben 
werden. Die erhaltene homotransplastome Masterpf lanze kann dann 
far beliebig viele unterschiedliche nachfolgende Trans formationen 
10 unter Verwendung des erf indungsgemaSen Verfahrens eingesetzt 
werden, was eine erhebliche Steigerung der Transf ormations- 
effizienz ermSglicht: Statt den herkommlichen Selektionsprozess 
fur eine homotransplastome Pflanze jedes Mai vollstandig durch- 
laufen zu mussen, muss er hier nur einmal realisiert werden. 

15 

Aufgrund der Vielzahl der im Stand der Technik beschriebenen 
Rekombinasen mit definierten RE-Sequenzen, ist es moglich und 
bevorzugt, Masterpf lanzen zu erzeugen, die mehrere verschiedene 
singulare RE-Sequenzen in ihr plastidares Genom eingebaut haben. 

20 Es konnen dann auch verschiedene Transformationsvektoren - auch 
gleichzeitig - eingebracht werden. Beim Nutzen verschiedener 
Erkennungsregionen, die entweder schon in der Masterpf lanze 
vorhanden sind oder aber jeweils mit dem neu transf ormierten 
Trans formationskonstrukt eingebracht werden, kann das Verfahren 

25 beliebig oft wiederholt werden. Nicht alle eingebrachten Vektoren 
mussen mittels Rekombinasen insertiert werden (es konnen auch 
verschiedene Insertionssequenzen mittels verschiedener Inte- 
grationsmechanismen insertiert werden) ; nicht alle - optional 
kein - Transf ormationskonstrukte mussen einen Selektionsmarker 

30 kodieren. Selektionsmarker konnen auch in trans auf einem anderen 
Konstrukt vorhanden sein. Dieses zusatzliche Konstrukt kann auch 
nur einen Selektionsmarker umfassen (beispielsweise "binding type 
marker" wie z.B. eine Punktmutation in der 16SrDNA zum Erreichen 
einer Spectomycinresistenz ) . 

35 

Fur im Rahmen der Erfindung vorteilhaft einzusetzende RE- 
Sequenzen seien beispielhaft - aber nicht einschrankend - die 
in nachfolgender Tabelle 1 wiedergegebenen Erkennungssequenzen 
far die jeweiligen aufgefuhrten Rekombinasen genannt. 



45 
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Tabelle 1: Erkennungssequenzen von Rekombinasen 
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Rekombinase 


Refer enz 


RE-Seguenz 


5 


4»C31 


attP 


Groth AC et al. 
(2000) Proc Natl 
Acad Sci USA 97: 
5995-6000 


GTAGTGCCCCAACTGGGGTAAC- 
CTTTGAGTTCTCTCAGTTGGGGGCGTAG 


10 


*C31 


attB 


Groth AC et al. 
(2000) Proc Natl 
Acad Sci USA 97: 
5995-6000 


CGGGTGCCAG- 

GGCGTGCCCTTGGGCTCCCCGGGCGCGTAC 




TP901 


-1 attP 


Brondsted L 
(1999) Appl Env 
Microbiol 65: 
752-758 


TCCAACTCGCTTAATTGCGAGTTTTTATTTCG 
TTTATTTCAATTAAGGTAACTAAAAAACTCCT 
TTTAAGGAGTTTCTG 


15 


TP901 


-1 attB 


aus Y15043 Nu- 
keotide (kompli- 
mentar 
1925-1825) 


AGCTTTGGCAAAAAAAGCAAAAAGCATTTACC 
TTGATTGAGATGTTAATTGTGTTGGCAATTAT 
CAGTATTTTAATTTTGCTTTTTGTGCCAAATT 
TGATA 


20 


Cre 




ATAACTTCGTATA GCATACAT TATAC- 
GAAGTTAT (loxP nativ) 




Cre 


Albert H et 
1995, Plant 
7: 649-659 


al, 
J: 


lox66: ataacttcgtata gcatacat 
tatacgaacggta 


25 


Cre 




lox71: taccgttcgtata gcatacat 


Cre 




lox76: ataacttcgtata gcatacat 
tatacgcccggta 




Cre 




lox75: taccgggcgtata gcatacat 


30 


Cre 




lox43: ataacttcgtata gcatacat 
tataggtaccgag 




Cre 




lox44: aatgcatgctata gcatacat 
tatacgaagttat 




FLP 




GAAGTTCCTATaC TTTCTAGA GAATAG- 
GAACTTC C GAATAGGAACTTC 


35 


FLP 




GAAGTTCCTATaC TTTCTAGA GAATAG- 
GAACTTC 


40 


X Integrase 
attP 




aatgctctgttacaggtcactaataccatcta 
agtagttgattcatagtgactgcatatgttgt 
gttttacagtattatgtagtctgttttttatg 
caaaatctaatttaatatattgatatttatat 
cattttacgtttctcgttcagcttttttatac 
taagttggcattataaaaaagcattgcttatc 
aatttgttgcaacgaacaggtcactatcagtc 
aaaataaaatcattatttgatttc 


45 


k Integrase 
attB 




aagcctgcttttttatactaacttgag 
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5 



Rekombinase 


Ref erenz 




R4 attB 


Olivares EC 
(2001) Gene 278: 
167-176 


agttgcccatgaccatgccgaagcagtggta- 
gaagggcaccggcagacac 


R4 attP 


Olivares EC 
(2001) Gene 278: 
167-176 


gcatgttccccaaagcgataccacttgaagca 
gtggtactgcttgtgggtacactctgcgggtg 



Dabei sind auch Abweichungen (Degenerationen) der Erkennungs- 

10 sequenz umfasst, die dennoch Erkennung und Rekombination durch 
die jeweilige Rekombinase ermoglichen, beispielsweise pseudo RE- 
Sequenzen. Ferner sind Kernsequenzen ( "Core "-Sequenzen) dieser 
Erkennungssequenzen umfasst. Es ist bekannt, dass auch die 
inneren Anteile der Erkennungssequenzen fur eine Rekombination 

15 gentigen und dass die aufieren nicht unbedingt relevant sind, 
jedoch die Effizienz der Rekombination mitbestimmen konnen. 
Ferner konnen die angegebenen Sequenzen beliebig an beiden 
Seiten erganzt oder erweitert werden, indem beispielsweise, 
gr5£ere flankierende Bereiche aus den entsprechenden nattirlichen 

20 Sequenzen ubernommen werden. Der Begriff der RE-Sequenz umfasst 
insofern auch alle wesentlichen gleichen Erkennungssequenzen. Im 
wesentlichen gleiche Erkennungssequenzen meint solche Erkennungs- 
sequenzen, die zwar Abweichungen von der fur das jeweilige Enzym 
als optimal gefundenen Erkennungs sequenz aufweisen, jedoch eine 

25 Rekombination durch dasselbe noch erlauben. 

Da die loxp Sequenz bislang nur im Pi Phagengenom gefunden wurde, 
bedingt die Verwendung der identischen loxP Sequenz eine vorher- 
gehende Einfuhrung derselben in das Plastom (s.u. mittels z.B. 

30 homologer Rekombination) . Verschiedene Studien haben jedoch 

bereits gezeigt, dass eine exakte Identitat mit der nattirlichen 
loxP Sequenz nicht zwingend fur eine Cre-vermittelte Rekombi- 
nation erforderlich ist (Sternberg et al. (1981) J Mol Biol 
150:487-507; Sauer J (1992) Mol Biol 223:911-928; Sauer (1996) 

35 Nucl Acids Res 24:4608-4613). 

Orientierung und Lokalisation der RE-Sequenzen 

Deletion: Fur eine Deletion werden zwei RE-Sequenzen, die durch 
40 die Einwirkung einer Rekombinase miteinander rekombinieren 
konnen, intramolekular mit gleicher Orientierung plaziert. 
Die zu deletierende Sequenz befindet sich zwischen den beiden 
RE-Sequenzen. Es entstehen 2 MolekQle und jedes tragt eine 
der beiden Sequenzen, die sich aus der Rekombination besagter 
45 RE-Sequenzen ergeben. 
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Insertion: Die Insertion ist die Ruckreaktion der Deletion. Zwei 
miteinander rekombinierbare RE-Sequenzen werden auf 2 Molekulen 
plaziert. Das zu insertierende Molekul ist in der einfachsten 
Anwendung zirkular. Die Integration wird in der Art und Weise 
5 vorgenommen, in der sich beide RE-Seguenzen in entsprechender 
Orientierung anordnen. Das entstehende Produkt tragt dann zwei 
Sequenzen, die sich aus der Rekombination besagter RE~Sequenzen 
ergeben, in entsprechender Orientierung. 

10 Es ist auch moglich, zwei RE-Sequenzen, die nicht miteinander 

rekombinieren konnen, auf einem Molekul mit gleicher Orientierung 
zu plazieren. In dem zweiten Molekul, welches dann nicht zwangs- 
laufig zirkular sein muss, werden dann ebenfalls zwei RE-Sequen- 
zen, welche nicht miteinander aber rait denen auf dem anderen 

15 Molekul rekombinieren konnen, mit gleicher Orientierung plaziert 
(s. unten "Replacement " Strategie) . Das Ergebnis der bevorzugten 
Reaktion ist ein Austausch der zwischen den RE-Sequenzen auf bei- 
den Molekulen befindlichen Sequenzen. 

20 Inversion: Zwei miteinander rekombinierbare RE-Sequenzen werden 
auf einem Molekul mit gegenlauf iger Orientierung plaziert. Die 
zugehorige Rekombinase kann dann eine Inversion der zwischen 
den RE-Sequenzen befindlichen Sequenzen bedingen. Sofern die 
durch die Rekombination entstehenden hybriden RE-Sequenzen nicht 

25 durch Einwirkung besagter Rekombinase allein wieder miteinander 
rekombinieren konnen, ist die Inversion irreversibel . 

"Enzym geeignet zur Induktion von DNA-Doppelstrangbriichen an der 
Erkennungssequenz zur gezielten Induktion von DNA-Doppelstrang- 
30 bruchen" (infolge "DSBI-Enzym w fur "Rouble strand-break inducing 
enzyme ") meint allgemein all solche Enzyme, die in der Lage sind, 
sequenzspezifisch Doppelstrangbriiche in doppelstrangige DNA 
zu erzeugen. Beispielsweise aber nicht einschrankend sind zu 
nennen : 

35 

1. Restriktionsendonukleasen, bevorzugt Typ II Restriktions- 
endonukleasen, besonders bevorzugt Homing-Endonukleasen wie 
weiter unten im Detail beschrieben. 

40 2. Kiinstliche Nukleasen wie weiter unten im Detail beschrieben, 
wie beispielsweise chimere Nukleasen, mutierte Restriktions- 
oder Homing-Endonukleasen oder RNA-Proteinpartikel abgeleitet 
von mobilen Introns der Gruppe II. 

45 Sowohl naturliche als auch ktinstlich hergestellte DSBI-Enzyme 
sind geeignet. Bevorzugt sind all solche DSBI-Enzyme, deren 
Erkennungssequenz bekannt ist und die entweder in Form ihrer 
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Proteine (beispielsweise durch Aufreinigung) gewonnen oder unter 
Verwendung ihrer Nukleinsauresequenz exprimiert werden konnen. 

Als kunstliche DSBI-Enzyme seien beispielhaft chimare Nukleasen 
5 zu nennen, die sich aus einer unspezif ischen Nukleasedomane und 
einer sequenzspezif ischen DNA-Bindungsdomane (z.B. bestehend aus 
Zinkfingern) zusammensetzen (Smith J et al. (2000) Nucl Acids 
Res 28(17) :3361-3369; Bibikova M et al. (2001) Mol Cell Biol. 
21:289-297; Chandrasegaran S und Smith J (1999) Biol Chem 
10 380:841-848; Kim YG und Chandrasegaran S (1994) Proc Natl Acad 
Sci USA 91:883-887; Kim YG et al. (1996) Proc Natl Acad Sci USA 
93:1156-1160; Nahon E und Raveh D (1998) Nucl Acids Res 
26:1233-1239) . 

15 Bevorzugt wird das DSBI-Enzym unter Kenntnis seiner spezifischen 
Erkennungsseguenz so ausgewahlt, dass es zusatzlich zu der Ziel- 
Erkennungssequenz keine weitere funktionellen Erkennungsregionen 
im Plastom besitzt. Ganz besonders bevorzugt sind deshalb Homing- 
Endonukleasen (Ubersicht: Belfort M und Roberts RJ (1997) Nucleic 

20 Acids Res 25:3379-3388; Jasin M (1996) Trends Genet 12:224-228; 
Internet: http: //rebase. neb.com/rebase/rebase. homing. html; 
Roberts RJ and Macelis D (2001) Nucleic Acids Res 29: 268-269). 
Diese erfullen aufgrund ihrer langen Erkennungssequenzen diese 
Anforderung. Aufgrund der geringen GrSfie des Plastoms ist es 

25 jedoch auch denkbar, dass DSBI-Enzyme mit kurzeren Erkennungs- 
sequenzen (beispielsweise Restriktionsendonukleasen) mit Erfolg 
eingesetzt werden kSnnen. 

Ganz besonders bevorzugt sind 

30 

I-NanI (Elde M et al. (1999) Eur J Biochem. 259:281-288; Gen- 
Bank Acc.-No.: X78280, Nukleotide 418 bis 1155), 

I-NitI (GenBank Acc.-No.: X78277, Nukleotide 426 bis 1163), 

35 

I-Njal (GenBank Acc.-No.: X78279, Nukleotide 416 bis 1153), 

I-Ppol kodiert auf der extrachromosomaler DNA im Kern von 
Physarum polycephalum (Muscarella DE und Vogt VM (1989) Cell 
40 56:443-454; Lin J und Vogt VM (1998) Mol Cell Biol 

18:5809-5817; GenBank Acc.-No.: M38131, Nukleotide 86 bis 
577; siehe auch SEQ ID NO: 4), 

I-Pspl (GenBank Acc.-No.: U00707, Nukleotide 1839 bis 3449), 

45 
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I-Scal (Monteilhet C et al. (2000) Nucleic Acids Res 28: 
1245-1251; GenBank Acc.-No.: X95974, Nukleotide 55 bis 465) 

Endo Seel (Kawasaki et al. (1991) J Biol Chem 266:5342-5347, 
5 identisch zu F-Scel; GenBank Acc.-No.: M63839, Nukleotide 159 

bis 1589), 

I-SceII (Sarguiel B et al. (1990) Nucleic Acids Res 
18:5659-5665), 

10 

I-SceIII (Sarguiel B et al. (1991) Mol Gen Genet. 
255:340-341) , 

I-Ssp6803I (GenBank Acc.-No. : D64003, Nukleotide 35372 bis 
15 35824), 

I-TevI (Chu et al. (1990) Proc Natl Acad Sci USA 
87:3574-3578; Bell-Pedersen et al. (1990) Nucleic Acids 
Resl8: 3763-3770; GenBank Acc.-No.: AF158101, Nukleotide 
20 144431 bis 143694) , 

I-TevII (Bell-Pedersen et al. (1990) Nucleic Acids Res 
18:3763-3770;GenBank Acc.-No.: AF158101, Nukleotide 45612 
bis 44836) , 

25 

I-TevIII (Eddy et al. (1991) Genes Dev. 5:1032-1041), 

Ganz besonders bevorzugt sind kommerziell erhaltliche Homing- 
Endonukleasen wie I-Ppol, PI-PspI oder Pl-Scel. Am meisten bevor- 
30 zugt ist I-Ppol. 

Am meisten bevorzugt ist die Homing-Endonuklease gema£ den 
Proteinsequenzen beschxieben durch SEQ ID NO: 5. Bei der Her- 
stellung entsprechender Expressionskassetten werden demzufolge 
35 Nuleinsauresequenzen eingesetzt, die fur ein Protein gemaS 
SEQ ID NO: 5 kodieren, insbesonders bevorzugt ist dabei die 
Verwendung der Nukleinsauresequenzen gemaS SEQ ID NO: 4. 

Weiterhin konnen Restriktionsendonukleasen (Typ II) vorteil- 
40 haft als DSBI-Enzyme verwendet werden, wenn sie keine Schnitt- 
stellen im Plastom aufweisen. Besonders bevorzugt sind dabei 
die Restriktionsendonukleasen NotI, CciNI, Fsel, Sbfl, Sdal und 
Sse8387I. 

45 Besonders bevorzugt werden DSBI-Enzyme entsprechend den oben 
fur Rekombinasen beschriebenen Verfahren so exprimiert, dass 
die Ausubung ihrer Funktion in den Plastiden gewahrleistet ist. 
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Besonders bevorzugt ist dabei die Expression als Fusionsprotein 
mit einer PLS oder die Integration einer Expressionskassette in 
die plastidare DNA. 

5 "Erkennungssequenz zur gezielten Induktion von DNA-Doppelstrang- 
bruchen" (infolge "DSB-Erkennungssequenz" fiir Doppelstrangbruch- 
Erkennungssequenz ) meint allgemein solche Sequenzen, die unter 
den Bedingungen in den Plastiden der jeweils verwendeten pflanz- 
lichen Zelle oder Pflanze die Erkennung und Spaltung durch ein 

10 DSBI-Enzym erlauben. Besonders bevorzugt sind DSB-Erkennungs- 

sequenzen fur Homing-Endonukleasen, die naturlicherweise in Mito- 
chondrien oder Kern anderer Organismen kodiert sind. Es konnen 
auch DSB-Erkennungssequenz en der Homing-Endonukleasen genutzt 
werden, die aus Plastiden (beispielsweise von Griinalgen) stammen. 

15 Bevorzugt ist die DSB-Erkennungssequenz singular in der plasti- 
daren DNA, d.h. ein Doppelstrangbruch wird nur an der vor- 
definierten Stelle erzeugt. Es sind jedoch auch Falle denkbar, 
bei denen mehr als eine DSB-Erkennungssequenz im Plastom vorhan- 
den ist. Dies ist insbesondere der Fall, wenn die DSB-Erkennungs- 

20 sequenz in duplizierten Genen (z.B. in invertierten "Repeats") 
lokalisiert ist. Im letzteren Fall liegen mehr als eine identi- 
sche DSB-Erkennungssequenz vor, ihr Kontext ist jedoch identisch. 
Es ist sogar bevorzugt, dass die DSB-Erkennungssequenz in alle 
Kopien der "Repeats" vorhanden ist, so dass auch ein Schnitt in 

25 alien Kopien erfolgen kann. DSB-Erkennungssequenzen, die zwar 
mehr als einmal in einem Plastom auftreten, jedoch im gleichen 
plastomen Kontext lokalisiert sind (z.B. in "Repeats" oder Gen- 
duplikationen) sind Im Rahmen dieser Erfindung unter dem Begriff 
der singularen DSB-Erkennungssequenzen subsumiert. 

30 

Bevorzugt ist die eingesetzte Pflanze oder von dieser abgeleitete 
Zelle beziiglich der DSB-Erkennungssequenz uberwiegend homoplastom 
oder homotransplastom, d.h. dass die uberwiegende Anzahl der in 
einem Plastid enthaltenen plastidaren DNA-Molekule diese DSB- 
35 Erkennungssequenz aufweisen. Solche Pflanzen werden auch als 
Masterpflanzen im Rahmen dieser Erfindung bezeichnet. 

Tabelle 2: Erkennungssequenzen und Herkunftsorganismus von DSBI- 
Enyzmen {" A " gibt innerhalb einer Erkennungssequenz die Schnitt- 
40 stelle des DSBI-Enzyms an.) 
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5 



10 



20 



30 



35 



45 



DSBI-Enzym 


Herkunf ts- 
organisinus 


Erkennungssequenz 


I-SceII 


Saccharomy- 
siae 


5 - -TTTTGATTCTTTGGTCACCC A TGAAGTATA 
3 ' -AAAACTAAGAAACCAG A TGGGACTTCATAT 




Saccharomy- 
siae 


5 ' -ATTGGAGGTTTTGGTAAC A TATTTATTACC 
3 ' -TAACCTCCAAAACC A ATTGATAAATAATGG 


P-Scel 


Saccharomy- 
ces cerevi- 
siae 


5 ' -GATGCTGTAGGC A ATAGGCTTGGTT 
3 ' -CTACGACA A TCCGTATCCGAACCAA 


P-Scell 


Saccharomy- 
ces cerevi- 
siae 


5 ' -CTTTCCGCAACA A GTAAAATT 
3 ' -GAAAGGCG A TTGTCATTTTAA 


I-NanI 


Naegleria 
andersoni 


3 ' -TTCAGACC A ACGGTCGTGGGCG 


I-NitI 


Naegleria 
italica 


5 ' -AAGTCTGGTGCCA A GCACCCGC 
3 ' -TTCAGACC A ACGGTCGTGGGCG 


I-Ppol 


Physarum 
polycephalum 


5 ' -TAACTATGACTCTCTTAA A GGTAGCCAAAT 
3 ' -ATTGATACTGAGAG A AATTCCATCGGTTTA 
'Core Sequenz": 

CTCTCTTAA A GGTAGC 

GAGAG A AATTCCATCG 


I-Scal 


Saccharomy- 
ces capensis 


5 ' -TGTCAC ATTGAGGTGCACT A AGTTATTAC 
3 ' -ACAGTGTAACTCCAC A GTGATCAATAATG 


I-Ssp6803I 


Synechocy- 
stis species 


5 ' -GTCGGGCT A CATAACCCGAA 
3 ' -CAGCCCGAGTA A TTGGGCTT 


PI-PspI 


Pyrococcus 


5 ' - AAAATCCTGGCAAAC AGCTATTAT A GGGTAT 
3 - _TTTTAGGACCGTTTGTCGAT A AATACCCATA 


I-Tevl 


Bacterio- 
phage T4 


5 ' -AGTGGTATCAAC A GCTCAGTAGATG 
3 ' -TC ACC ATAGT A TGCGAGTCATCTAC 


I-TevII 


Bacterio- 
phage T4 


5 ' — GCTTATGAGTATGAAGTGAACACGT A TATTC 
3 ' -CGAATACTCATACTTCACTTGTG A CAATAAG 


NotI 


Nocardia 
otitidis- 
caviarum 


5 ' — GC A GGCCGC— 3 ' 


CciNI 


Curto- 
bac t er ium 
citreum N 


5 ' — GC A GGCCGC— 3 ' 


Fsel 


Frankia 
species 
Eullb 




Sbfl 


species 
Bf-61 


5 ' -CCTGCA A GG-3 ' 


Sdal 


Streptomyces 
diastaticus 
Ng7-324 


5'-CCTGCA A GG-3' 


Sse8387I 


Streptomyces 
specied 8387 


5 ' -CCTGCA A GG-3 ' 
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Aufbau des Transformationskonstruktes mit der Insertionssequenz 



Auf dem Trans formationskonstrukt, welches zur Transformation 
der Plastiden besagter Masterpf lanzen genutzt wird, befindet 
5 sich wenigstens eine RE-Sequenz R2, welche unter Einwirkung 
der Rekombinase mit einer RE-Sequenz Rl in der Masterpf lanze 
rekombinieren kann. 

In einer bevorzugten Ausfuhrungsform fiihrt die Rekombination von 

10 Rl mit R2 zu hybriden Rekombinaseerkennungssequenzen (Rl/2 bzw. 
R2/1) , die selber fiir die Rekombinase allein nur schlechte oder 
keine Rekombinationssubstrate darstellen. Dabei konnen besagte 
hybride Sequenzen durchaus Substrate fur die betreffende Rekombi- 
nase darstellen, wenn weitere Faktoren hinzutreten (z.B. die 

15 Faktor xis und IHF bei Einsatz der X Rekombinase) . Bevorzugt 
sind diese weiteren Faktoren jedoch nicht gleichzeitig mit der 
Rekombinase in dem pflanzlichen Organismus vorhanden. Bevorzugt 
ist die Geschwindigkeit einer Rekombinationsreaktion unter Ein- 
satz der RE-Sequenzen Rl und/oder R2 mindestens zehnfach so hoch 

20 wie fiir den Einsatz der hybriden Sequenzen Rl/2 und/oder R2/1, 
bevorzugt mindestens hundertfach so hoch, besonders bevorzugt 
mindestens eintausendfach so hoch, am meistens bevorzugt min- 
destens zehntausendfach so hoch. Dadurch liegt das Gleichgewicht 
der Rekombination stark auf der Seite der Insertion, so dass die 

25 Reaktion quasi irreversibel ist. 

In einer bevorzugten Ausfuhrungsform umfasst die RE-Sequenz 
(beispielsweise die RE-Sequenz Rl, Rl' , R2 oder R2') - in 
5 ' /3 ' -Richtung - eine erste Sequenz R-5' , gefolgt von einer Kern- 
30 sequenz sowie einer zweiten Sequenz R-3 ' . Eine besonders bevor- 
zugte Form dieser Sequenzen umfasst die loxP Sequenz, die FRT 
Sequenz oder die attB bzw. attP der 3>C31 oder TP901-1 Rekombi- 
nase. 

35 In einer weiteren bevorzugten Ausfuhrungsform ist mindestens eine 
der beiden RE-Sequenzen eine pseudo RE-Sequenz oder eine hybride 
RE-Sequenz . 

Ist die Rekombinase beispielsweise ausgewahlt aus der Gruppe der 
40 Resolvasen/Invertasen wie - besonders bevorzugt - <&C31 Rekombi- 
nase, TP901-1 Rekombinase oder R4 Rekombinase, so sind die 
Sequenzen Rl und R2 bevorzugt nicht identisch. Bevorzugt ent- 
sprechen die Sequenzen Rl und R2 den Sequenzen attB und attP, 
Oder umgekehrt. Weiterhin kann mindestens eine der beiden 
45 Sequenzen attB oder attP durch eine entsprechende pseudo-attB 
oder pseudo-attP RE-Sequenz ausgetauscht sein. 



WO 03/054201 PCT/EP02/14303 
43 

Die attB Sequenz umfasst bevorzugt - in. 5 ' /3 '-Richtung - eine 
erste DNA-Sequenz (attB-5'), gefolgt von einer Kernregion und 
einer zweiten Sequenz (attB-3'). 

5 Die attP Sequenz umfasst bevorzugt - in 5 ' /3 ' -Richtung - eine 
erste DNA-Sequenz (attP-5'), gefolgt von einer Kernregion und 
einer zweiten Sequenz (attP-3'). 

Besonders bevorzugt ist eine Aus ftthrungs form, bei der durch die 
10 Rekombinase-vermittelte Rekombination zwischen attB und attP ein 
Rekombinationsprodukt entsteht, dass nicht mehr als Substrat fur 
die Rekombinase allein (d.h ohne Mitwirkung zusatzlicher Fakto- 
ren) fungi eren kann. Dieses Rekombinationsprodukt enthalt bevor- 
zugt eine Region bestehend aus - in 5 ' /3 ' -Richtung - einer ersten 
15 DNA-Sequenz (attB-5'), gefolgt von dem Rekombinationsergebnis der 
beiden Kernregionen und einer zweiten Sequenz (attP-3') sowie 
eine zweite Region bestehend aus - in 5 ' /3 ' -Richtung - einer 
ersten DNA-Sequenz (attP-5'), gefolgt von dem Rekombinations- 
ergebnis der beiden Kernregionen und einer zweiten Sequenz 
20 (attB-3'). 

Insbesondere bevorzugt, ist mindestens eine der beiden RE- 
Sequenzen attB und/oder attP eine pseudo-RE-Sequenz (att<|>) 
umfassend - in 5 ' /3 ' -Richtung - eine erste DNA-Sequenz (att<j>-5'), 

25 gefolgt von einer Kernregion und einer zweiten Sequenz (att<|>-3'). 
Die bei der Rekombination entstehenden Sequenzen umfassen bei- 
spielhaft eine Region bestehend aus - in 5 ' /3 ' -Richtung - einer 
ersten DNA-Sequenz {att0-5'), gefolgt von dem Rekombinations- 
ergebnis der beiden Kernregionen und einer zweiten Sequenz 

30 (attP-3') sowie eine zweite Region bestehend aus - in 5'/3'- 
Richtung - einer ersten DNA-Sequenz (attP-5 ' ) , gefolgt von dem 
Rekombinationsergebnis der beiden Kernregionen und einer zweiten 
Sequenz (att<|)-3'), wobei die entstandenen Regionen nicht mehr 
als Substrat fur die Rekombinase fungieren konnen, wodurch die 

35 Insertion quasi irreversibel ist. Alternativ konnen naturlich 
auch attB und att<|> entsprechend rekombiniert werden. 

So ftthrt beispielsweise bei Verwendung der Cre Rekombinase 
die Rekombination der RE-Sequenzen lox66 und lox71 (s. oben) 

40 zu einer wildtyp loxP RE-Sequenz und der lox72 RE-Sequenz 

(5'-taccgttcgtata gcatacat tatacgaacggta-3 ' ) , die nur noch sehr 
ineffizient miteinander rekombinieren konnen (Araki K et al. 
(1997) Nucl Acids Res 25:868-872). Ebenso ftthrt die Rekombination 
der RE-Sequenzen lox76 und lox75 (s. oben) zu einer wiltyp loxP 

45 RE-Sequenz und der lox72 RE-Sequenz (5 ' -taccgggcgtata gcatacat 
tatacgcccggta-3 ' ) , die nur noch sehr ineffizient miteinander 
rekombinieren k6nnen. GleichermaSen ftthrt die Rekombination der 
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RE-Sequenzen lox43 und lox44 zu Wildtyp loxP RE-Sequenz und der 
lox65 RE-Sequenz (5-aatgcatgctata gcatacat tataggtaccgag-3 ' ) , 
die nur noch sehr ineffizient miteinander rekombinieren konnen 
(Albert H et al. (1995) Plant J 7:649- 659). Allgemein sollten 
5 fur die Verwendung im Rahmen dieser Erfindung "right element (RE) 
mutant lox sites" und "left element (LE) mutant lox sites" 
etabliert werden, welche miteinander rekombinieren konnen. Die 
resultierende loxP (Wildtyp) RE-Sequenz und die RE/LE mutierte 
RE-Sequenz rekombinieren nur noch sehr schlecht miteinander. 
10 Dies liegt vor all em daran, dass die LE/RE Mutante nicht mehr 
als Substrat erkannt werden kann. 

Als Rekombinasen, die fur nahezu irreversible Rekombination 
genutzt werden konnten, sind insbesondere die TP901-1 Rekombi- 
15 nase, die OC31 Rekombinase, die R4 Rekombinase. Moglich sind 

ferner Jt-Integrase (bevorzugt mit Coexpression von IHF), Cre (mit 
entsprechend mutierten RE-Sequenzen, s.o.), Flp (mit entsprechend 
mutierten RE-Sequenzen) und die L5 Rekombinase. 

20 Ferner kann das Transf ormationskonstrukt einen Selektionsmarker 
enthalten. Falls in der Masterpflanze bereits ein Selektionsmar- 
ker vorhanden ist, unterscheiden sich vorzugsweise besagten 
Selektionsmarker. Daruberhinaus umfasst das Transf ormations- 
konstrukt bevorzugt ein oder mehrere Gene von Interesse. 

25 

Regulatorische Elemente konnen ebenfalls auf dem Transformations- 
konstrukt vorhanden sein, mit dem RE-Konstrukt bereits in die 
Masterpflanze eingebracht worden sein, Oder es konnen endogene, 
naturlicherweise am Integrationsort vorhandene regulatorische 
30 Elemente genutzt werden. 

Das Transformationskonstrukt ist bevorzugt in einem Trans- 
formationsvektor enthalten, der weitere Elemente, wie beispiels- 
weise fur eine Replikation in Bakterien, umfassen kann. 

35 

Enthalt das Transformationskonstrukt nur eine einzelne RE-Sequenz 
R2, so stellt das Transformationskonstrukt bevorzugt ein zirku- 
lares DNA-Molektil dar. In diesem Fall kann das Transformations- 
konstrukt mit dem Transf ormationsvektor identisch sein. Es ist 

40 jedoch nicht notwendig, dass die vektoriellen Sequenzen (z.B. 

Replikationsur sprung zur Vermehrung der DNA in Bakterien und ggf . 
einen bakteriellen Selektionsmarker ebenfalls) in das Plastiden- 
genom integriert werden. Bevorzugt werden diese Sequenzen des 
Vektorriickgrats vor der Transformation entfernt. Dazu kann man 

45 beispielsweise die Insertionssequenz von zwei Erkennungsstellen 
fur Restriktionsenzyme umgeben. Nach Vervielf altigen des ent- 
sprechenden Vektors in einem Bakterium wie E. coli kann man die 
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isolierte DNA sodann mit der entsprechenden Restriktionsendo- 
nuklease bzw. den entsprechenden Restriktionsendonukleasen in 
vitro behandeln. Damit wird die Insertionssequenz vom Vektor- 
ruckgrat getrennt und kann in vitro durch den Einsatz einer 
5 Ligase wieder zirkularisiert werden. Die isolierte und zirku- 
larisierte Insertionssequenz kann dann fur die Transformation 
eingesetzt werden. Alternativ kann die Insertionssequenz auch 
mittels Polymerasekettenreaktion unter Wahl geeigneter Primer 
amplifiziert und zirkularisiert werden. 

10 

Alternativ und besonders bevorzugt wird das Vektorruckgrat von 
der Insertionssequenz mit Hilfe von Rekombinasen entfernt. Dazu 
umgibt man das zu trans formierende Fragment mit zwei Erkennungs- 
stellen fur eine Rekombinase, mit deren Hilfe man eine Excision 
15 des zu transformierenden Fragmentes vornehmen kann (beispiels- 
weise Cre-lox, FLP/frt) . Es ist moglich, die Ansatze in der Art 
zu gestalten, dass durch die Aktion der Rekombinase erst die fur 
die Integration der Insertionssequenz notwendige RE-Sequenz R2 
entsteht. 

20 

Es ist auch moglich, den kompletten Trans formationsvektor zu 
trans formieren und mittels Rekombinasen zu integrieren. Bevorzugt 
werden in diesem Fall die Vektorruckgratsequenzen anschliefiend 
durch geeignete Excisionsverfahren wieder eliminiert. 

25 

Urn die Ef f izienz des erf indungsgemaSen Verfahrens der Integration 
mittels Erkennungsstellen-spezifischer Rekombination weiter 
zu steigern, kann beispielsweise die Kopiezahl der zu transfor- 
mierenden DNA Molektile erhSht werden, indem das Trans format ions - 

30 konstrukt Elemente (z.B. einen plastidaren ORI origin of replica- 
tion, Replikationsursprung) umfasst, die es ihm ermoglichen, 
vor der Integration in die plastidare DNA im Plastid autonom zu 
replizieren oder stabil als extrachromosomales DNA-Molekiil in den 
Plastiden zu existieren. Entsprechende Verfahren sind dem Fach- 

35 mann bekannt <US 5,693,507; US 5,932,479; WO 99/10513). Dieses 
Verfahren ist bevorzugt, da es die zur Integration im Plastid zur 
Verfugung stehende Kopienzahl der Insertionssequenzen steigert. 

Alternativ kann auch eine "Replacement" Strategie genutzt werden. 

40 Dazu werden in den Masterpf lanzen zwei RE-Sequenzen Rl und Rl', 
die unter Einwirkung der entsprechenden Rekombinase bzw. Rekombi- 
nasen nicht miteinander rekombinieren konnen, eingebracht (bzw. 
Sequenzen genutzt, die naturlicherweise dort vorhanden sind) . Das 
Transformationskonstrukt enthalt dann Erkennungs sequenzen R2 und 

45 R2 ' , die nicht miteinander unter Einwirkung der Rekombinase oder 
Rekombinasen rekombinieren, wobei aber Rl mit R2 und Rl' mit R2' 
rekombinieren kann. Dadurch wird die Sequenz zwischen Rl und Rl' 
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in der Masterpf lanze durch die Sequenz zwischen R2 und R2' auf 
dem Trans format ionskonstrukt ausgetauscht. Die "Replacement" 
Strategie ermoglicht es nicht nur, Vektorrtickgrat Insertionen zu 
vermeiden, ermSglicht es daruber hinaus, die Insertionssequenz 
5 (zuzgl. der Anteile der Erkennungssequenzen R2 und R2') als 
linearisiertes Fragment einzubringen. Eine solche * Replacement " 
Strategie wurde zum Beispiel in Mauszellen mit Hilfe unterschied- 
licher Erkennungsregionen fur die Cre Rekombinase demonstriert 
(Bethke B and Sauer B (1997) Nucl Acids Res 25:2828-2834). 

10 Die "Replacement" Strategie wurde auch bereits im Kern von 

Schizisacchromyces pombe mit der Rekombinase *C31 verwirklicht 
(Thomason LC (2001) Mol Gen Genet 265:1031-1038) . Beim Nutzen der 
"Replacement" Strategie wird ein eventuell mit dem RE-Konstrukt 
eingebrachter Selektionsmarker bevorzugt zwischen den Erkennungs- 

15 regionen Rl und Rl' positioniert , so dass er bei Insertion der 
Insertionssequenz flankiert von R2 und R2' direkt aus der Master- 
pf lanze eliminiert wird. 

Bevorzugt konnen bei der "Replacement" Strategie 2 RE-Sequenzen 
20 (Rl und Rl' bzw. R2 und R2 ' ) (beispielsweise jeweils 2 lox 

Sequenzen) genutzt werden, die nicht miteinander rekombinieren 

konnen, weil sie sich beispielsweise im Spacer unterscheiden 

(siehe auch Bethke B et al. (1997) Nucl Acids Res 25:2828-2834). 

Ahnliches auch fur das FLP/frt beschrieben worden, bei dem ins- 
25 besondere die meisten Nukleotide der Spacer Region ausgetauscht 

werden konnen (Schlake, T & Bode, J, 1994, Biochemistry 33: 

12746-12751) . 

Fur die Replacement Strategie konnen auch 2 gleiche attB bzw. 
30 attP Sites genutzt werden. Diese konnen nicht untereinander 
rekombinieren . 

In einer weiteren - besonders bevorzugten Aus fuhrungs form - ent- 
halt das RE-Konstrukt bevorzugt zusatzlich zur Erkennungsstelle 
35 fur eine Rekombinase auch mindestens eine Erkennungsstelle fur 
ein DSBI-Enzym. Diese Konstrukte werden infolge auch als RE/DSB- 
Konstrukt bezeichnet, sind aber auch unter dem allgemeinen 
Begriff des RE-Konstruktes subsumiert. 

40 Das jeweilige DSBI-Enzym besitzt - aufier der uber das RE/DSB- 
Konstrukt eingebrachten - bevorzugt keine weiteren DSB- 
Erkennungsstellen im Plastom (auSer: Duplikationen beispiels- 
weise in "repeats"). Es ist nicht zwingend notwendig, dass die 
DSB-Erkennungsseguenz auf dem RE/DSB-Konstrukt vorhanden ist. 

45 Sie kann auch naturlicherweise im Plastom benachbart zu der 
Insertionsstelle eines RE-Konstruktes vorhanden sein. Eine 
funktionelle RE/DSB-Einheit entsteht dann erst nach der Inte- 
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gration des RE-Konstruktes in das Plastom. Mit Hilfe des RE/DSB- 
Konstruktes wird zunachst eine uberwiegend homoplastome Master- 
pflanze erzeugt, wobei dem Fachmann vertraute Verfahren wie bei- 
spielsweise die Homologe Rekombination eingesetzt werden. 

5 

In einer weiteren Ausfuhrungsf orm wird durch die Insertionsse- 
quenz zusatzlich eine Sequenz X in das Plastom eingefiihrt, welche 
homolog zu einer bereits im Plastom vorhandenen Sequenz X'. der 
Masterpflanze ist. Diese Sequenz X' kann naturlicherweise vor- 
10 handen sein, oder aber durch das RE/DSB-Konstrukt eingefiihrt . 

werden. Die Sequenzen X und X' sind so lokalisiert, dass zwischen 
ihnen - nach der Integration der Insertionssequenz mittels 
Rekombination - nachfolgende Elemente zu liegen kommen: 

15 i) eine bevorzugt singulare DSB-Erkennungssequenz fur ein DSBI- 
Enzym 

ii) hybride RE-Sequenz Rl/2 der Rekombinase, die sich nach dem 
Einbau des sekundaren Transf ormationsvektors durch Rekombi- 

20 nation von Rl mit R2 ergeben hat 

iii) ggf. weitere Elemente wie beispielsweise positive oder 
negative Selektionsmarker 

25 wobei X und X' eine Orientierung sowie ausreichende Homologie 
und Lange besitzen, um infolge eines sequenzspezif ischen Doppel- 
strangbruches an der DSB-Erkennungssequenz homolog mit einander 
zu rekombinieren und eine Deletion der zwischen ihnen gelegenen 
Sequenzen zu bewirken. 

30 

Das Transf ormationskonstrukt, der Transf ormationsvektor oder die 
Insertionssequenz werden wie oben beschrieben in die Plastiden 
eingebracht. Durch die Aktivitat einer entsprechenden Rekombinase 
wird die Insertionssequenz in das Plastom eingebaut. Bevorzugt 
35 wird ein System genutzt, welches in der eingesetzten Form nahezu 
oder vollstandig irreversibel ist. Besonders bevorzugt werden die 
Rekombinasen der Phagen OC31 oder TP901-1 und ihre entsprechenden 
Erkennungsregionen genutzt. 

40 Nach Integration der Insertionssequenz wird in einer besonders 
bevorzugten Ausfuhrungsf orm eine entsprechendes DSBI-Enzym indu- 
ziert, das an seiner DSB-Erkennungssequenz im Plastom der Master- 
pflanze ein DNA Doppelstrangbruch erzeugt. 



45 
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Nun sind zwei Falle zu unterscheiden : 

a) Die betrachtete Kopie der plastidaren DNA ist bereits in der 
gewunschten Weise durch Rekombinase vermittelte Insertion der 
Insertionssequenz modifiziert worden. Der DNA Doppelstrang- 
bruch erfolgt an einer Erkennungsregion, die benachbart zu 
besagter Insertionssequenz lokalisiert ist. Durch intramole- 
kulare homologe Rekombination zwischen X und X' wird nun die 
zwischen diesen lokalisierte DSB-Erkennungss telle entfernt 
Oder zumindest derart zerstdrt werden, dass sie nicht mehr 
von dem DSBI-Enzym erkannt wird. In Folge konnen die so modi- 
fizierten plastidaren DNA-Molekule nicht mehr durch das DSBI- 
Enzym geschnitten werden. Sie konnen stSrungsfrei replizieren 
und/oder als Substrate fur Reperatursynthesen weiterer - noch 
nicht modifizierter - plastidarer DNA-Molekiile fungieren. In 
einer Variante dieser Ausfuhrungsf orm wird durch die indu- 
zierte Deletion ein negativer Selektionsmarker deletiert, was 
eine erleichterte Selektion der plastidaren DNA-Molekiile mit 
Deletion ermoglicht. 

b) Die betrachtete Kopie plastidare DNA ist noch nicht in der 
gewunschten Weise durch Rekombinase vermittelte Insertion der 
Insertionssequenz modifiziert worden. Auch in diesem Fall 
ergibt sich ein DNA-Doppelstrangbruch. Hier steht jedoch 
intramolekular keine homologe Region zur Verfugung, die zur 
Reparatur des Doppelstrangbruches genutzt werden kSnnte. Es 
ist intramolekular keine Rekombination zwischen X und X' m6g- 
lich, demnach auch keine Deletion der DSB-Erkennungssequenz . 
Die so geschnittenen plastidaren DNA-Molekule kSnnen zum 
einen nicht mehr ungestort replizieren. Zum anderen konnen 
besagte geschnittene Molekule im Rahmen einer Reperatur- 
synthese durch ein Genkonversionsereignis unter Verwendung 
von Kopien der bereits in der gewunschten Weise modifizier- 
ten, nicht mehr schneidbaren plastidaren DNA-Molekule (die 
also in Folge der oben unter a) beschriebenen Erexgnisse 
keine DSB-Erkennungssequenz mehr enthalten) repariert werden. 
So konnen auch ohne selektive Regeneration das Trans- 
formationskonstrukt / die Insertionssequenz in alle oder 
zumindest die uberwiegende Anzahl der Plastomkopien eines 
Plastids verteilt werden. Dies Verfahren beschleunigt den 
Prozess der Plastidentrans formation und verringert aufgrund 
weniger notwendiger Regenerationsschritte die Gefahr der 
Anhaufung von somaklonalen Variationen. Aufierdem ermSglicht 
es, eine Verteilung des Transgens in die Kopien des Plastoms 
zu erzielen, ohne einen Selektionsmarker und entsprechendes 
selektives Agenz nutzen zu mussen. 
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Das Transformationskonstrukt kann weitere Elemente umfassen. So 
kann es wiinschenswert sein, zwischen Sequenzbereich X und der 
DSB-Erkennungssequenz mindestens ein Gen fur einen positiven 
und/oder negativen Selektionsmarker zu platzieren. Durch die 
5 induzierte Rekombination werden so auch die Selektionsmarker bzw. 
jeder andere beliebige Sequenzabschnitt, der sich zwischen den 
homologen Bereichen X und X' befindet, eliminiert. Entsprechend 
kann auf diese Weise beispielsweise das Vektorruckgrat - wenn es 
nicht vor der Insertion entfernt wurde - wieder aus dem Plastom 
10 eliminiert werden. 

Als DSBI-Enzym wird bevorzugt die Endonuklease I-Ppol aus Physa- 
rum polycephalum genutzt. Es ist aber auch moglich, jedes andere 
DSBI-Enzym zu nutzen, das in den betrachteten Organell aktiv ist. 

15 Das DSBI-Enzym wird bevorzugt erst nach der Rekombinase, die fur 
den Einbau des Transf ormationsvektors / der Insert ions sequenz 
verantwortlich ist, aktiviert. Auch hier sind verschiedene Mog- 
lichkeiten denkbar, dies zu realisieren. Entsprechende Verfahren 
sind bereits fur die Rekombinase beschrieben worden und sind auf 

20 das DSBI-Enzym tibertragbar. So kann das DSBI-Enzym in Fusion mit 
einem Transitpeptid im Kern der Masterpf lanze exprimiert werden. 
Die Expression sollte bevorzugt induzierbar sein oder im Fall von 
konstitutiver Expression sollte die AktivitSt der entsprechenden 
Endonuklease aktivierbar sein. Dariiber hinaus kann das DSBI-Enzym 

25 als Fusion mit einem Transitpeptid in Agrobakterien exprimiert 
und als Fusionsprotein beispielsweise mit VirF in Pflanzenzellen 
eingebracht werden. Auch transiente Expression vom Kern mit post- 
trans lational em Import in die betrachteten Plastiden ist denkbar. 
Bevorzugt wird das DSBI-Enzym bzw. eine das DSBI-Enzym kodierende 

30 Nukleinsauresequenz jedoch erst mit dem Trans format ionsvektor in 
die Plastiden der Masterpf lanze eingebracht. Dies kann dadurch 
geschehen, da£ das DSBI-Enzym als Protein gleichzeitig mit dem 
Transformationskonstrukt/ der Insertionssequenz in die Organellen 
eingebracht wird; daS eine in vitro erstellte RNA, die das DSBI- 

35 Enzym kodiert, mit dem Transformationskonstrukt/ der Insertions- 
sequenz in die Plastiden eingebracht wird; oder dass - besonders 
bevorzugt - eine das DSBI-Enzym kodierende DNA mit dem Trans- 
formationskonstrukt/ der Insertionssequenz in die Plastiden ein- 
gebracht wird. Ganz besonders bevorzugt ist das DSBI-Enzym in 

40 letzterem Fall in einer in dem Plastid exprimierbaren Form co- 
diert. Besonders bevorzugt ist das DSBI-Enzym auf der Insertions- 
sequenz codiert. Ganz besonders bevorzugt wird die Expression des 
DSBI-Enzyms erst nach der Insertion der Insertionssequenz ermSg- 
licht. Dies kann beispielsweise dadurch erreicht werden, dafi auf 

45 dem Transformationskonstrukt / der Insertionssequenz keine regu- 
latorischen Elemente vorhanden sind, die die Expression des DSBI- 
Enzymes steuern. Die Expression des DSBI-Enzymes konnte in einem 
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solchen Fall beispielsweise nach Integration in die plastidare 
DNA auch durch regulatorische Blemente aus dem Plastom der 
Masterpflanze gesteuert werden. Falls die Expressionskassette 
fur das DSBI-Enzym auf der Insertionssequenz enthalten ist, wird 
5 - besonders bevorzugt - das DSBI-Enzym von Bereichen flankiert, 
die eine spatere Excision des DSBI-Enzyms erlauben. 

In einer bevorzugten Aus fuhrungs form umfasst die Insertions- 
sequenz mindestens eine weitere zu exprimierende Nukleinsaure- 

10 sequenz, die bevorzugt einen gewiinschten Phanotyp in einer ent- 
sprechend trans formierten Pflanze erzeugt. Um die Expression 
(Transkription und/oder Translation) zu gew&hrleisten, sind diese 
- je nach Aus fuhrungs form und Insertionsort - mit regulatorischen 
Elementen zu versehen. Erfolgt die Insertion in einen trans- 

15 kriptionell aktiven Lokus so sind - wie oben beschrieben - keine 
Promotorsequenzen erf orderlich. Vorteilhaft werden die zu expri- 
mierenden Sequenzen in jedem Fall mit Ribosomenbindestellen in 
geeignetem Abstand stromaufwarts des of fenen Leserahmens versehen 
oder besitzen bereits solche von Natur aus. Diese regulatorischen 

20 Sequenzen oder Teile derselben k6nnen aber auch im Plastom natur- 
licherweise vorhanden sein oder bereits im ersten Schritt, d.h. 
bei der Generierung einer nicht-natiirlichen Masterpflanze zu- 
sammen mit der der RE-Sequenz in die plastidare-DNA eingeftihrt 
werden . 

25 

"Ausreichende Lange" meint in Bezug auf die Homologiesequenzen 
{z.B. A, A', B, B', X, X', HI, H2 ) bevorzugt Sequenzen von 
einer Lange von mindestens 20 Basenpaaren, bevorzugt mindestens 
50 Basenpaaren, besonders bevorzugt von mindestens 100 Basen- 
30 paaren, ganz besonders bevorzugt von mindestens 250 Basenpaaren, 
am meistens bevorzugt von mindestens 500 Basenpaaren. 

"Ausreichende Homologie" meint in Bezug auf die Homologie- 
sequenzen {z.B. A, A', B, B', X, X', HI, H2) bevorzugt Sequenzen . 

35 die eine Homologie innerhalb dieser Homologiesequenzen aufweisen 
von mindestens 70 %, bevorzugt 80 %, vorzugsweise mindestens 
90 %, besonders bevorzugt mindestens 95 %, ganz besonders bevor- 
zugt mindestens 99 %, am meisten bevorzugt 100 % iiber eine Lange 
von mindestens 20 Basenpaaren, bevorzugt mindestens 50 Basen- 

40 paaren, besonders bevorzugt von mindestens 100 Basenpaaren, ganz 
besonders bevorzugt von mindestens 250 Basenpaaren, am meistens 
bevorzugt von mindestens 500 Basenpaaren. 

Unter Homologie zwischen zwei Nukleinsauren wird die Identitat 
45 der Nukleinsauresequenz uber die jeweils gesamte Sequenzlange 

verstanden, die durch Vergleich mit Hilfe des Programmalgorithmus 
GAP (Wisconsin Package Version 10.0, University of Wisconsin, 
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Genetics Computer Group (GCG) , Madison, USA) unter Einstellung 
folgender Parameter berechnet wird: 

Gap Weight: 12 Length Weight: 4 

5 

Average Match: 2,912 Average Mismatch: -2 , 003 

Bevorzugt umfasst das Trans formationskonstrukt oder die Inserti- 
onssequenz einen Selektionsmarker, der eine Selektion trans- 
10 plastomer Plastiden ermoglicht (s.u.), besonders bevorzugt aadA, 
BADH Oder einen "binding type"-Marker . Der Selektionsmarker ist 
bevorzugt so konstruiert, dass eine nachfolgende Deletion aus dem 
Plastom ermoglicht wird. Entsprechende Verfahren sind dem Fach- 
mann bekannt und unten beschrieben. 

15 

Die Insertionssequenz , das Transformationskonstrukt, das RE-Kon- 
strukt oder die Expressionskassetten fur eine Rekombinase oder 
ein DSBI-Enzym konnen zum Aufbau eines Trans formationsvektor in 
einen Standard-Vektor wie pBluescript oder pUC18 kloniert werden. 
20 In einer bevorzugten Aus ftthrungs form wird die Insertionssequenz 
bzw. Transformationskonstrukt als lineares oder linearisiertes 
DNA-Molekul appliziert. 

Bevorzugt wird nur der Teil des Transformationsvektors appli- 
25 ziert, der die Insertionssequenz oder das Transformationskon- 
strukt mit RE-Sequenz, Selektionsmarker und/oder die Expressions- 
kassette fur das DSBI-Enzym umfasst. 

Eines der oben beschriebenen Konstrukte kann mit einem der 
30 beschriebenen Verfahren in die Plastiden einer entsprechenden 
Masterpflanze eingebracht werden. Bevorzugt sind Mikroinjektion 
und besonders bevorzugt Partikelbeschuss . 

Klonierungs-, Expressions-, Selektions- und Transformations- 
35 verfahren 

"Expressionskassette" meint - zum Beispiel in Bezug auf die 
Expressionkassette fur eine Rekombinase oder ein DSBI-Enzym - 
solche Konstruktionen bei denen die zu exprimierende DNA in funk- 

40 tioneller Verkntipfung mit mindestens einem genetischen Kontroll- 
element steht, dass ihre Expression (d.h. Transkription und oder 
Translation) ermoglicht oder reguliert. Dabei kann die Expression 
zum Beispiel stabil oder transient, konstitutiv oder induzierbar 
erfolgen. Fur die Einfuhrung stehen dem Fachmann verschiedene 

45 unten aufgefiihrte direkte (z.B. Transf ektion, Partikelbeschuss, 
Mikroinjektion) oder indirekte Verfahren (z.B. Agrobakterien- 
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infektion, Virusinf ektion) zur Verftigung, die weiter unten auf- 
gefiihrt werden. 

Unter einer funktionellen Verknupfung versteht man allgemein eine 
5 Anordnung in der eine genetische Kontrollsequenz ihre Funktion in 
Bezug auf eine Nukleinsauresequenz - beispielsweise kodierend fur 
eine Rekombinase oder ein DSBI-Enzym - ausuben kann. Funktion 
kann dabei beispielsweise die Kontrolle der Expression d.h. Tran- 
skription und/oder Translation der Nukleinsauresequenz - bei- 

10 spielsweise kodierend fur eine Rekombinase oder ein DSBI-Enzym - 
bedeuten. Kontrolle umfasst dabei beispielsweise die Initiierung, 
Steigerung, Steuerung oder Suppression der Expression d.h. Tran- 
skription und ggf . Translation. Die Steuerung wiederum kann bei- 
spielsweise gewebe- und oder zeitspezif isch erfolgen. Sie kann 

15 auch induzierbar zum Beispiel durch bestimmte Chemikalien, 
Stress, Pathogene etc. sein. 

Unter einer funktionellen Verknupfung versteht man zum Beispiel 
die sequentielle Anordnung eines Promoters, der zu exprimierenden 

20 Nukleinsauresequenz - beispielsweise kodierend fur eine Rekombi- 
nase oder ein DSBI-Enzym - und ggf. weiterer regulativer Elemente 
wie zum Beispiel einem Terminator derart, dass jedes der regu- 
lativen Elemente seine Funktion bei der Expression der Nuklein- 
sauresequenz - beispielsweise kodierend fur eine Rekombinase oder 

25 ein DSBI-Enzym - er fallen kann. Dabei ist es nicht zwingend not- 
wendig, dass die funktionelle Verknupfung bereits auf den Trans- 
formationskonstrukten gegeben ist. Die funktionelle Verknupfung 
kann sich auch in Folge der Insertion in die Kern- bzw. plasti- 
dare DNA ergeben, wobei hier die regulativen Elemente bereits 

30 in der Kern- bzw. plastidaren DNA vorliegen. Die regulativen 
Elemente konnen diesbezuglich naturlicherweise vorliegen oder 
aber in einem vorgeschalteten Schritt - beispielsweise bei der 
Einftthrung einer RE-Sequenz - eingebracht werden. 

35 Dazu ist nicht unbedingt eine direkte Verknupfung im chemischen 
Sinne erf orderlich. Genetische Kontrollsequenzen, wie zum Bei- 
spiel Enhancer-Sequenzen, konnen ihre Funktion auch von weiter 
entfernten Positionen oder gar von anderen DNA-Molekulen aus auf 
die Zielsequenz ausuben. Bevorzugt sind Anordnungen, in denen die 

40 zu exprimierende Nukleinsauresequenz - beispielsweise codierend 
fur eine Rekombinase oder ein DSBI-Enzym - hinter eine als 
Promoter fungierende Sequenz posit ioniert wird, so dass beide 
Sequenzen kovalent miteinander verbunden sind. Bevorzugt ist 
dabei der Abstand zwischen der Promotorsequenz und der Nuklein- 

45 sauresequenz - beispielsweise kodierend fur eine Rekombinase oder 
ein DSBI-Enzym - geringer als 200 Basenpaare, besonders bevorzugt 
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kleiner als 100 Basenpaare, ganz besonders bevorzugt kleiner 
als 50 Basenpaare. 

Dem Fachmann sind verschiedene Wege bekannt, urn zu einem 
5 der erfindungsgemaSen Transf ormationskonstrukte, diese umfassen- 
den Vektoren Oder einer der Expressionskassetten zu gelangen. 
Die Herstellung kann mittels gangiger Rekombinations- und 
Klonierungstechniken realisiert werden, wie sie beispielsweise 
in Maniatis T, Fritsch EF und Sambrook J, Molecular Cloning: A 

10 Laboratory Manual, Cold Spring Harbor Laboratory, Cold 
Spring Harbor, NY (1989) sowie in Silhavy T J , Berman ML 
und Enguist LW, Experiments with Gene Fusions, Cold Spring Harbor 
Laboratory, Cold Spring Harbor, NY (1984) und in Ausubel FM et 
al., Current Protocols in Molecular Biology, Greene Publishing 

15 Assoc. and Wiley Interscience (1987) beschrieben sind. Bevorzugt 
ist die direkte Fusion einer als Promoter fungierenden Nuklein- 
sauresequenz mit einer zu exprimierenden Nukleotidsequenz - bei- 
spielsweise kodierend fur eine Rekombinase oder ein DSBI-Enzym. 

20 Der Begriff der "genetischen Kontrollsequenzen" ist breit zu 
verstehen und meint all solche Sequenzen, die einen Einfluss 
auf das Zustandekommen oder die Funktion einer Expressions- 
kassette oder Transf ormationsvektors haben. Genetische Kontroll- 
sequenzen gewahrleisten die Transkription und gegebenenfalls 

25 Translation in Zellkern (bzw. Zytoplasma) oder Plastiden. Vor- 
zugsweise umfassen die erfindungsgemaSen Expressionskassetten 
5'-stromaufwarts von der jeweiligen zu exprimierenden Nuklein- 
sauresequenz einen Promotor und 3 ' -stromabwarts eine Terminator- 
sequenz als zusatzliche genetische Kontrollsequenz , sowie 

30 gegebenenfalls weitere ubliche regulative Elemente, und zwar 

jeweils funktionell verknupft mit der zu exprimierenden Nuklein- 
sauresequenz . 

Genetische Kontrollsequenzen sind beispielsweise beschrieben bei 
35 w Goeddel; Gene Expression Technology: Methods in Enzymology 185, 
Academic Press, San Diego, CA (1990)" oder "Gruber and Crosby, 
in: Methods in Plant Molecular Biology and Biotechnolgy, CRC 
Press, Boca Raton, Florida, eds.: Glick and Thompson, Chapter 7, 
89-108" sowie den dort aufgewiesenen Zitaten. 

40 

Beispiele fur derartige Kontrollsequenzen sind Sequenzen, an 
die Induktoren oder Repressoren binden und so die Expression der 
Nukleinsaure regulieren. Zusatzlich zu diesen neuen Kontroll- 
sequenzen oder anstelle dieser Sequenzen kann die natiirliche 
45 Regulation dieser Sequenzen vor den eigentlichen Strukturgenen 
noch vorhanden sein und gegebenenfalls genetisch verandert worden 
sein, so dass die naturliche Regulation ausgeschaltet und die 
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Expression der Gene erhoht wurde. Die Expressionskassette kann 
aber auch einfacher aufgebaut sein, das heifit, es werden keine 
zusatzlichen Regulationssignale vor die vorstehend erwahnten Gene 
insertiert und der natiirliche Promoter mit seiner Regulation wird 
5 nicht entfernt. Stattdessen wird die natiirliche Kontrollsequenz 
so mutiert, dass keine Regulation mehr erfolgt und die Gen- 
expression gesteigert wird. Diese veranderten Promotoren kSnnen 
auch allein vor die natiirlichen Gene zur Steigerung der Aktivitat 
gebracht werden. 

10 

Je nach vorstehend nSher beschriebenen pflanzlichen Organismen, 
die als Wirts- oder Ausgangsorganismus zum Einsatz kommen konnen, 
und der durch Einbringen der Expressionskassetten oder Vektoren 
in einen genetisch veranderten oder transgenen Organismus uber- 
15 fuhrt wird, eignen sich verschiedene Kontrollsequenzen. 

Zur nuklearen Expression (beispielsweise einer viralen/Bakterio- 
phagen RNA-Polymerase, einer Rekombinase oder eines DSBI-Enzyms 
jeweils als Fusionsprotein mit einem plastidaren Transitpeptid) 
20 sind grundsatzlich alle Promotoren geeignet, die die Expression 
von Genen, insbesondere Fremdgenen, in Pflanzen steuern kSnnen. 

Geeignet sind Promotoren, die eine konstitutive Expression in 
Pflanzen ermoglichen (Benfey et al.(1989) EMBO J 8:2195-2202). 

25 Vorzugsweise verwendet man insbesondere einen pflanzlichen 

Promotor oder einen Promotor, der einem Pf lanzenvirus entstammt. 
Besonders bevorzugt ist der Promotor des 35S-Transkriptes des 
Blumenkohlmosaikvirus (Franck et al. (1980) Cell 21:285-294; 
Odell et al.(1985) Nature 313:810-812; Shewmaker et al. (1985) 

30 Virology 140:281-288; Gardner et al. 1986, Plant Mol. Biol. 6, 
221-228) oder den 19S CaMV Promotor (US 5,352,605 and 
WO 84/02913). Dieser Promotor enthalt bekanntlich unterschied- 
liche Erkennungssequenzen fur transkriptionale Effektoren, die 
in ihrer Gesamtheit zu einer weitgehend permanenten und konsti- 

35 tutiven Expression des eingefiihrten Gens fiihren (Benfey et al. 
(1989) EMBO J 8:2195-2202). Ein weiterer geeigneter konstitutiver 
Promotor ist der "Rubisco small subunit (SSU) "-Promotor (US 
4,962,028). Ein weiteres Beispiel eines geeigneten Promotors ist 
der LeguminB-Promotor (GenBank Acc.-No.: X03677) . Weitere bevor- 

40 zugte konstitutive Promotoren sind zum Beispiel der Promotor 

der Nopal insynthase aus Agrobakterium, der TR-Doppelpromotor , der 
OCS (Octopin Synthase) Promotor aus Agrobakterium, der Ubiquitin 
Promotor (Holtorf S et al. (1995) Plant Mol Biol 29:637-649), 
die Promotoren der vakuolarer ATPase Untereinheiten, der FBPaseP 

45 Promotor (WO 98/18940) oder der Promotor eines prolinreichen 
Proteins aus Weizen (WO 91/13991) . Weiterhin geeignete und im 
Rahmen dieser Erfindung bevorzugte konstitutive Promotoren .sind 
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der SuperPromotor (Ni Met al. (1995) Plant J 7:661-676; 
US 5,955,646) sowie der Nitrilase-1 Promotor des nitl Gens aus 
Arabidopsis (GenBank Acc.-No. : Y07648.2, Nukleotide 2456 bis 
4340; Hillebrand H et al. (1998) Plant Mol Biol 36 (1) :89-99; 
5 Hillebrand H et al. (1996) Gene 170 (2) :197-200) . 

Bevorzugt sind induzierbare, besonders bevorzugt chemisch 
induzierbare Promotoren (Aoyama T und Chua NH (1997) Plant J 
11:605-612; Caddick MX et al. (1998) Nat. Biotechnol 16:177-180; 

10 Rewiew: Gatz (1997) Anrm Rev Plant Physiol Plant Mol Biol 

48:89-108), durch die die Expression zu einem bestimmten Zeit- 
punkt gesteuert werden kann. Beispielhaft seien zu nennen der 
PRP1 Promotor (Ward et al. (1993) Plant Mol Biol 22:361-366), 
ein durch SalicylsSure induzierbarer Promotor (WO 95/19443), 

15 ein durch Benzolsulfonamid-induzierbarer Promotor (EP-A-0388186) , 
ein durch Tetrazyklin-induzierbarer Promotor (Gatz et al. (1992) 
Plant J 2:397-404), ein durch Abscisinsaure-induzierbarer Promo- 
tor (EP-A 335 528) , ein durch Ethanol induzierbarer Promotor 
(Salter MG et al. (1998) Plant J. 16:127-132), der schwermetall- 

20 induzierbarer Metallothionein I Promotor (Amini S et al. (1986) 
Mol Cell Biol 6:2305-2316), der steroid-induzierbarer MMTV LTR 
Promotor (Izant JG et al. (1985) Science 229:345-352) sowie ein 
durch Cyclohexanon-induzierbarer Promotor (W0 93/21334) . Beson- 
ders bevorzugt ist die induzierbare Expression eines PLS/DSBI-En- 

25 zym-Fusionsproteins im Kern. Induzierbare Promotoren umfasst auch 
solche, die durch bestimmte Repressorproteine (z.B. tet, lac) re- 
guliert werden konnen. Entsprechende Repressorproteine k6nnen in 
Fusion mit PLS in die Plastiden translokalisiert werden und dort 
die Expression bestimmter Gene unter Kontrolle entsprechender 

30 Promotoren regulieren. Der Repressor bindet in den Plastiden an 
eine ktinstliche ins Plastom eingefiigte Repressorbindestelle und 
kann so die Expression des stromabwarts gelegenen Gens unterdriik- 
ken (vgl. W095/25787) . Dadurch kann beispielsweise die Expression 
einer plastidkodierten Rekombinase oder eines DSBI-Enzym im 

35 Bedarfsfall induziert oder sie bis auf den Moment, in dem die 
Expression gewunscht ist, unterdruckt werden. 

Ferner sind Promotoren bevorzugt, die durch biotischen oder 
abiotischen Stress induziert werden wie beispielsweise der 

40 pathogen-induzierbare Promotor des PRPl-Gens (Ward et al., 

Plant Mol Biol 1993, 22: 361-366), der hitzeinduzierbare hsp70- 
Promotor oder der hsp80-Promoter aus Tomate (US 5,187,267), 
der kalteinduzierbare alpha-Amylase Promoter aus der Kartoffel 
(WO 96/12814) oder der verwundungsinduzierte pinl I -Promoter 

45 (EP-A 0 375 091) . 
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In einer besonders bevorzugten Ausfuhrungsf onti wird vor allem 
die fur die Rekombinase oder das DSBI-Enzym kodierende Nuklein- 
saure unter Kontrolle eines induzierbaren Promotors exprimiert. 
Damit wird eine kontrollierte, steuerbare Expression erreicht 
5 und etwaige Probleme durch eine konstitutive Expression einer 
Rekombinase oder eines DSBI-Enzyms vermieden. 

Vorteilhafte Kontrollsequenzen far die erf indungsgemSHen 
Expressionskassetten oder Vektoren umfassen virale, bakteriophage 
10 oder bakterielle Promotoren wie cos-, tac-, trp-, tet-, phoA-, 
tat-, lpp-, lac-, laclq-, T7-, T5-, T3-, gal-, trc-, ara-, SP6-, 
X-pr- oder im X-PL-Promotor . Diese werden bevorzugt in Kombination 
mit der' Expression der jeweils korrespondierenden RNA-Polymerase 
eingesetzt. 

15 

Die Expression in Plastiden kann unter Verwendung plastidarer 
Promotoren und/oder Transkriptionsregulationselemente realisiert 
werden. Beispielhaf t jedoch nicht einschrankend seien zu nennen 
der RNA-Polymerase Promotor (WO 97/06250) oder die in 

20 WO 00/07431, US 5,877,402, WO 97/06250, WO 98/5559,5 WO 99/46394, 
WO 01/42441 und WO 01/07590 beschriebenen Promotoren. Zu nennen 
sind das rpo B Promo tore lement, das atpB Promotorelement , das 
clpP Promotorelement (siehe auch WO 99/46394) oder das 16S-rDNA 
Promotorelement. Dabei kann dem Promotor auch ein polycistroni- 

25 sches "Operon" zugeordnet sein (EP-A 1 076 095; WO 00/20611). 
Beschrieben sind auch Systeme bei denen eine nicht -pflanzliche 
(z.B. virale) RNA-Polymerase unter Verwendung plastidarer Trans - 
itpeptide in das Plastid importiert wird und dort spezifisch die 
Expression transgener Sequenzen induziert, die unter Kontrolle 

30 der Erkennungssequenzen der RNA-Polymerase stehen und zuvor in 
die plastidare DNA insertiert wurden (WO 95/16783; US 5,925,806; 
US 5,575,198) . 

Neben den genannten Promotoren waren weiter bevorzugt zu ver- 
35 wenden: 

a) der PrbcL Promotor (SEQ ID NO: 20) 

b) der Prpsl6 Promotor (SEQ ID NO: 26) 

40 

c) der Prrnl6 Promotor (SEQ ID NO: 22) 

In einer bevorzugten Ausftthrungsform werden NEP Promotoren ein- 
gesetzt. Dies sind Promotoren, die in Plastiden funktionell sind 
45 und von der nuklear kodierten, plastidaren RNA-Polymerasen (NEP) 
erkannt werden. Bevorzugt sind: Prm-62; Pycf 2-1577; PatpB-289; 
Prps2-152; Prpsl6-107; Pycf 1-41; PatpI-207; PclpP-511; PclpP-173 
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und PaccD-129 (WO 97/06250; Hajdukiewicz PTJ et al (1997) EMBO J 
16:4041-4048) . 

Besonders bevorzugt sind: 

5 

a) Der PaccD-129 Promotor des accD Gens aus Tabak (WO 97/06250; 
SEQ ID NO: 23) 

b) Der PclpP-53 Promotor des clpP Gens als hoch-aktiver NEP 
10 Promotor in Chloroplasten (WO 97/06250; SEQ ID NO: 24) 

c) Der Prrn-62 Promotor des rrn Gens (SEQ ID NO: 25) 

d) Der Prpsl6-107 Promotor des rpsl6 Gens (SEQ ID NO: 21) : 

15 

e) Der PatpB/E-290 Promotor des atpB/E Gens aus Tabak (Kapoor S 
et al. (1997) Plant J 11:327-337) (SEQ ID NO: 27) 

f ) Der PrpoB-345 Promotor des rpoB Gens (Liere K & Maliga P 
20 (1999) EMBO J 18: 249-257) (SEQ ID NO: 28) 

Im Allgemeinen sind in dieser Aus fuhrungs form alle Promotoren 
nutzbar, die der Klasse III angehSren (Hajdukiewicz PTJ et al 
(1997) EMBO J 16:4041-4048) sowie alle Fragmente der Promotoren 
25 der Klasse II, die die Transkriptionsinitiation durch die NEP 
steuern. Solche Promotoren bzw. Promotor-Anteile sind nicht be- 
sonders hoch konserviert. Als Consensus nahe der Transkriptions- 
initiationsstelle von NEP Promotoren wird angegeben: ATAGAATAAA 
(Hajdukiewicz PTJ et al (1997) EMBO J 16:4041-4048). 

30 

Normalerweise werden Gene von regulatorischen Sequenzen umgeben, 
die aus den Plastiden des zu trans formierenden Organismus stam- 
men. Dadurch erzeugt man Sequenzduplikationen, die zu Instabili- 
taten aufgrund von spontanen, intrachromosomalen homologen 

35 Rekombinationsereignissen fuhren k6nnen (Heifetz PB (2000) 

Biochimie 82 (6-7) : 655-666) . Es wurde zur Losung dieses Problems 
vorgeschlagen, heterologe regulatorische Sequenzen zu nutzen, 
Oder endogen im Plastidengenom bereits vorhandene regulatorische 
Einheiten auszunutzen (WO 99/46394; WO 01/42441). Auch eine Ver- 

40 minderung der Homologie durch Mutagenese der endogenen Promotor- 
sequenz ist beschrieben (WO 01/07590) . 

Prinzipiell kSnnen alle naturlichen Promotoren mit ihren 
Regulationssequenzen wie die oben genannten fur das erfindungs- 
45 gemaSe Verfahren verwendet werden. Besonders bevorzugt sind 
Promotoren isoliert aus Prokaryoten. Ganz besonders bevorzugt 
sind Promotoren isoliert aus Synechocystis oder E.coli. Daruber 
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hinaus kSnnen auch synthetische promotoren vorteilhaft verwendet 
werden, wie beispielsweise ein synthetischer Promotor abgeleitet 
von der E. coli Konsensus Sequenz fur a70 Promotoren: 

5 5-TTGACA N16-19 TATAAT N 3 CAT -3', 

wobei N fiir jedes beliebige Nukleotid (also A, G, C oder T) 
steht. Dem Fachmann ist of fensichtlich, dass auch einzelne bis 
wenige Basenaustausche in den angegebenen, konservierten Regionen 

10 moglich sind, ohne die Funktion des Promoters zu zerstSren. Die 
variable Gestaltung dieser synthetischen Promotoren durch Nutzen 
verschiedener Sequenzabf olgen, ermSglicht es, eine Vielzahl von 
Promotoren zu erstellen, die nicht extensive Homologien auf- 
weisen, was insbesondere fur den Fall, dass mehrere Promotoren 

15 bendtigt werden, die StabilitSt der Expressionskassetten im 

Plastom erhoht. Beispielhaft aber nicht einschr&nkend seien nach- 
folgende besonders bevorzugte Promotorsequenzen genannt, die von 
oben genannter Konsensussequenz abgeleitet sind: 

20 a) 5 ' -TTGACATTCACTCTTCAATTATCTATAATGATACA-3 ' (SEQ ID NO: 29) 
b) 5 ' -TTGACAATTTTCCTCTGAATTATATAATTAACAT-3 ' (SEQ ID NO: 59) 

Dem Fachmann ist of fensichtlich, dass diese synthetischen 
Promotoren die Expression beliebiger Gene steuern konnen. Sie 

25 konnen beispielsweise dazu genutzt werden, die Expression eines 
Selektionsmarkers anzutreiben - auch, urn unter regenerativen 
Bedingungen auf transplastome Pflanzen unter Zuhilfenahme von be- 
sagtem Selektionssystem selektieren zu konnen. Selektionsmarker 
sind weiter unten beispielhaft aufgezahlt. Dartiber hinaus konnen 

30 solche synthetischen Promotoren mit jedem beliebigen Gen ver- 
knupft werden, beispielsweise mit Genen kodierend fiir AntikSrper, 
Antigene oder Enzyme. Bevorzugt enthalten die Expressions- 
kassetten bestehend aus solchen Promotoren auch im folgenden 
naher beschriebene 5 ' -untranslatierte Regionen (oder Ribosomen- 

35 bindestellen) oder 3 ' -nichtkodierende Regionen. 

Genetische Kontrollsequenzen umfassen auch weitere Promotoren, 
Promotorelemente oder Minimalpromotoren, die die expressions- 
steuernden Eigenschaf ten modifizieren konnen. Genetische Kon- 

40 trollseguenzen umfassen ferner auch die 5 ' -untranslatierte Region 
<5'-UTR) oder die nichtkodierende 3 '-Region (3'-UTR) von Genen 
(Eibl C (1999) Plant J 19:1-13). Es ist gezeigt worden, dass 
diese eine signifikante Funktionen bei der Regulation der Gen- 
expression in Plastiden hoherer Pflanzen spielen konnen. Auch im 

45 Kern konnen genetische Kontrollelemente wie 5'-UTR, Introns oder 
3'UTR eine Funktion bei der Genexpression besitzen. So wurde bei- 
spielsweise gezeigt, dass 5 '-untranslatierte Sequenzen die trans- 
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iente Expression heterologer Gene verstarken konnen. Sie konnen 
ferner die Gewebespezif itat fSrdem (Rouster J et al. (1998) 
Plant J 15:435-440) . 

5 Bevorzugt werden als 5' UTRs und 3'UTRs eingesetzt: 

a) 5'psbA (aus Tabak) (SEQ ID NO: 30) 

b) 5'rbcL einschliefclich 5' Anteilen aus dem codierenden 

10 Bereich des rbcL Gens (aus Tabak) (SEQ ID NO: 31); die mit 

SEQ ID NO: 31 beschriebene Sequenz wurden gegeniiber der 
nativen Sequenz mutiert, um eine PagI bzw. Ncol Schnittstelle 
einzubringen. 

IS c) 5'rbcLs (SEQ ID NO: 32); die mit SEQ ID NO: 32 beschriebene 

Sequenz wurden gegeniiber der nativen Sequenz mutiert, um eine 
PagI Schnittstelle einzubringen. 

d) 3'psbA-l aus Synechocystis (SEQ ID NO: 33) 

20 

e) 3'psbA aus Tabak (SEQ ID NO: 34) 

f) 3'rbcL aus Tabak (SEQ ID NO: 35) 

25 Genetische Kontrollseguenzen vor allem fur die Expression in 
Plastiden umfassen insbesondere auch Ribosomenbindungssequenzen 
zur Initiation der Translation. Diese sind fur gewShnlich in 
den 5 'UTRs enthalten. Dies ist vor allem dann bevorzugt, wenn 
von der zu exprimierenden Nukleinsauresequenz entsprechende 

30 Sequenzen nicht bereitgestellt werden oder diese mit dem 
Expressionssystem nicht kompatibel sind. Insbesondere bevor- 
zugt ist die Verwendung einer synthetische Ribosomenbinde- 
stelle (RBS) mit der Sequenz 5'-GGAGG(N) 3 _i 0 ATG-3' , bevorzugt 
5'-GGAGG(N) 5 ATG-3' (SEQ ID NO: 36) besonders bevorzugt 5 ' -GGAG- 

35 GATCTCATG-3 ' (SEQ ID NO: 37). 

Die Expressionskassette kann vorteilhaf terweise eine oder mehrere 
sogenannte "enhancer Sequenzen" funktionell verknupft mit dem 
Promoter enthalten, die eine erhohte transgene Expression der 

40 Nukleinsauresequenz ermoglichen. Auch am 3'-Ende der transgen zu 
exprimierenden Nukleinsauresequenzen k5nnen zusatzliche vorteil- 
haf te Sequenzen insertiert werden, wie weitere regulatorische 
Elemente oder Terminatoren . Die transgen zu exprimierenden 
Nukleinsauresequenzen konnen in einer oder mehreren Kopien im 

45 Genkonstrukt enthalten sein. 
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Ferner ist es moglich, nach dem Startcodon eine sogenannte Down- 
stream-Box einzufugen, die die Expression im Allgemeinen steigert 
(Translations-"Enhancer" WO 00/07431; WO 01/21782) . 

5 Als genetische Kontrollsequenzen v. a. bei der Kemtransf ormation 
geeignete Polyadenylierungssignale sind pflanzliche Polyadeny- 
lierungssignale, vorzugsweise solche, die im wesentlichen T-DNA 
Polyadenylierungssignale aus Agrobakterium tumefaciens, insbe- 
sondere des Gens 3 der T-DNA (Octopin Synthase) des Ti-Plasmids 
10 pTiACHS entsprechen (Gielen et al., EMBO J. 3 (1984), 835 ff) 
oder funktionelle Aquivalente davon. Beispiele fur besonders 
geeignete Terminatorsequenzen sind der OCS (Octopin-Synthase) - 
Terminator und der NOS ( Nopal in-Synthase) -Terminator . 

15 Die erfindungsgemaSen Transformationsvektoren und Insertions- 
sequenzen kSnnen weitere Nukleinsauresequenzen umfassen. Solche 
Nukleinsauresequenzen kQnnen bevorzugt Expressionskassetten 
darstellen. Beispielhaft aber nicht einschrankend fur die in den 
Expressionskonstrukten zu exprimierenden DNA-Sequenzen seien zu 

20 nennen: 



1 . Selektionsmarker 

"Selektionsmarker" meint all solche Nukleinsaure- oder Protein- 

25 sequenzen, deren Expression (d.h. Transkription und ggf. Transla- 
tion) einer Zelle, Gewebe oder . Organismus einen anderen Phanotyp 
verleiht, als einer nicht trans formier ten. Selektionsmarker um- 
fasst beispielsweise solche Nukleinsaure- oder Froteinsequenzen, 
deren Expression einer Zelle, Gewebe oder Organismus einen Vor- 

30 teil (positiver Selektionsmarker) oder Nachteil (negativer Selek- 
tionsmarker) gegenOber Zellen vermittelt, die diese Nukleinsaure 
oder Protein nicht exprimieren. Positiven Selektionsmarkern 
wirken beispielsweise dadurch, das eine auf die Zelle inhibi- 
torisch wirkende Substanz detoxif iziert wird (Bsp. Antibiotika-/ 

35 Herbizidresistenz) , oder eine Substanz gebildet wird, welche der 
Pflanze unter den gewahlten Bedingungen verbesserte Regeneration 
oder erhohtes Wachstum ermoglicht (zum Beispiel nutritive Marker, 
hormonproduzierender Marker wie ipt; s.u.). Eine andere Form 
positiver Selektionsmarker umfasst mutierte Proteine oder RNAs, 

40 die gegenuber einem selektiven Agenz nicht empfindlich sind 
(beispielsweise 16S rRNA Mutanten, die unempf indlich gegenuber 
Spectinomycin sind) . Negative Selektionsmarker wirken beispiels- 
weise dadurch, dass sie die Bildung einer toxischen Substanz 
in den trans formierten Zellen katalysieren (zum Beispiel das 

45 codA Gen) . Ferner kann Selektionsmarker auch Reporterproteine 
umfassen, insofern diese geeignet sind, transformierte von nicht- 
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transformierten Zellen, Geweben oder Organen (beispielsweise 
durch Farbgebung oder einen anderen detektierbaren Phanotyp) zu 
unterscheiden. 

5 Nachfolgende Selektionsmarker seien beispielhaft und nicht ein- 
schrSnkend zu nennen: 

1.1 Positive Selektionsmarker: 

10 Der mit der Expressionskassette in den Zellkern oder die Plas.ti- 
den eingebrachte selektionierbare Marker verleiht den erfolgreich 
transformierten Zellen eine Resistenz gegen ein Biozid (zum Bei- 
spiel ein Herbizid wie Phosphinothricin, Glyphosat oder Bromoxy- 
nil), einen Me tabolismus inhibitor wie 2-Desoxyglucose-6-phosphat 

15 (WO 98/45456) oder ein Antibiotikum, wie zum Beispiel Tetra- 
cycline, Ampicillin, Kanamycin, G 418, Neomycin, Bleomycin oder 
Hygromycin. Der Selektionsmarker erlaubt die Selektion der trans- 
formierten Zellen von untransformierten (McCormick et al., Plant 
Cell Reports 5 (1986), 81-84; Dix PJ & Kavanagh TA (1995) Euphy- 

20 tica 85: 29-34). 

Besonders bevorzugte Selektionsmarker sind solche, die eine 
Resistenz gegen Herbizide verleihen. Beispielhaft als Selektions- 
marker seien genannt: 

25 

DNA Seguenzen, die fur Phosphinothricinacetyltransf erasen 
(PAT) kodieren, welche die freie Aminogruppe des Glutamin- 
synthaseinhibitors Phosphinothricin (PPT) acetylieren und 
damit eine Detoxif izierung des PPT erreichen (de Block et al. 

30 1987, EMBO J. 6, 2513-2518) (auch Bialophos® resistenzgen 

(bar) genannt) . Das bar Gen kodierend fur eine Phosphino- 
thricinacetyltransferase (PAT) kann aus beispielsweise 
Streptomyces hygroscopicus oder S. viridochromogenes isoliert 
werden. Entsprechende Seguenzen sind dem Fachmann bekannt 

35 (aus Streptomyces hygroscopicus GenBank Acc.-No.: X17220 

land X05822, aus Streptomyces viridochromogenes GenBank 
Acc.-No.: M 22827 und X65195; US 5,489,520). Ferner sind 
synthetische Gene beispielsweise far die Expression in 
Plastiden beschrieben. Ein synthetisches Pat Gen ist 

40 beschrieben in Becker et al. (1994) The Plant J. 5:299-307. 

Die Gene verleihen Resistenz gegen das Herbizid Bialaphos 
oder Glufosinat und sind vielbenutzte Marker in transgenen 
Pflanzen (Vickers JE et al. (1996). Plant Mol Miol Reporter 
14:363-368; Thompson CJ et al. (1987) EMBO J 6:2519-2523). 

45 
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5-Enolpyruvylshikimat-3-phosphatsynthasegene (EPSP Synthase- 
gene), die eine Resistenz gegen Glyphosat (N- (phosphono- 
methyDglycin) verleihen. Das unselektive Herbizid Glyphosat 
hat die 5-Enolpyruvyl-3-phosphoshikimatsynthase (EPSPS) als 
5 molekulares Target. Diese hat eine Schliisselfunktion in der 

Biosynthese aromatischer Aminosauren in Mikroben und Pflan- 
zen, jedoch nicht in Saugern (Steinrucken HC et al. (1980) 
Biochem. Biophys. Res. Commun. 94:1207-1212; Levin JG und. 
Sprinson DB (1964) J. Biol. Chem. 239: 1142-1150; Cole DJ 

10 (1985) Mode of action of glyphosate a literature analysis, p. 

48-74. In: Grossbard E und Atkinson D (eds.). The herbicide 
glyphosate. Buttersworths , Boston.). Glyphosat-tolerante 
EPSPS Varianten werden bevorzugt als Selektionsmarker 
verwendet (Padgette SR et al. (1996). New weed control 

15 opportunities: development of soybeans with a Roundup Ready™ 

gene. In: Herbicide Resistant Crops (Duke, S.O., ed.), pp. 
53-84. CRC Press, Boca Raton, FL; Saroha MK und Malik VS 
(1998) J Plant Biochemistry and Biotechnology 7:65-72). Das 
EPSPS Gen des Agrobakterium sp. strain CP4 hat eine nattir- 

20 liche Toleranz gegen Glyphosat, die auf entsprechende trans- 

gene Pflanzen transferiert werden kann. Das CP4 EPSPS Gen 
wurde aus Agrobakterium sp. strain CP4 kloniert (Padgette 
SR et al. (1995)Crop Science 35(5) :1451-1461) . Sequenzen 
von 5-Enolpyrvylshikimate-3-phosphate-synthasen, die Gly- 

25 phosat-tolerant sind, wie beispielsweise beschrieben in 

US 5,510,471; US 5,776,760; US 5,864,425; US 5,633,435; 
US 5,627;061; US 5,463,175; EP 0 218 571, sind sowohl in den 
Patenten beschriebenen als auch in der GenBank hinterlegt. 
Weitere Sequenzen sind beschrieben unter GenBank Accession 

30 X63374. Ferner ist das aroA Gen bevorzugt (M10947 S. typhi - 

murium aroA locus 5-enolpyruvylshikimate-3 -phosphate synthase 
(aroA protein) gene) . 

das fur das Glyphosat® degradierende Enzyme kodierende gox 
35 Gen (Glyphosatoxidoreduktase) . GOX (beispielsweise die 

Glyphosatoxidoreductase aus Achromobacter sp.) katalysiert 
die Spaltung einer C-N Bindung im Glyphosat, welches so zu 
Aminomethylphosphonsaure (AMPA) und Glyoxylat umgesetzt wird. 
GOX kann dadurch eine Resistenz gegen Glyphosat vermitteln 
40 (Padgette SR et al. (1996) J Nutr. 1996 Mar; 126 (3 ): 702-16 ; 

Shah D et al. (1986) Science 233: 478-481). 

das deh Gen (kodierend fur eine Dehalogenase, die Dalapon® 
inaktiviert) , (GenBank Ac c . -No. : AX022822, AX022820 sowie 
45 W099/27116) 
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bxn Gene, die fur Bromoxynil degradierende Nitrilase- 
enzyme kodieren. Beispielsweise die Nitrilase aus Klebsiella 
ozanenae. Sequenzen sind in der Genbank beispielsweise 
unter den Acc.-No: E01313 (DNA encoding bromoxynil specific 
5 nitrilase) und J03196 (K. pneumoniae bromoxynil-specif ic 

nitrilase (bxn) gene, complete cds) zu finden. 

Neomycinphosphotransferasen verleihen eine Resistenz 
gegen Antibiotika (Aminoglykoside) wie Neomycin, G418, 
Hygromycin, Paromomycin oder Kanamycin, indem sie durch 
eine Phosphorylierungsreaktion deren inhibierende Wirkung 
reduzieren. Besonders bevorzugt ist das nptll Gen. Sequenzen 
konnen aus der GenBank erhalten werden (AF080390 Mini- 
transposon mTn5-GNm; AF080389 Minitransposon mTn5-Nm, 
complete sequence) . Zudem ist das Gen bereits Bestandteil 
zahlreicher Expressionsvektoren und kann unter Verwendung 
von dem Fachmann gelaufigen Verfahren (wie beispielsweise 
Polymerasekettenreaktion) aus diesen isoliert werden 
(AF234316 pCAMBIA-2301; AF234315 pCAMBIA-2300, AF234314 
pCAMBIA-2201) . Das NPTII Gen kodiert fur eine Aminoglycos id- 
s' O-phosphotransf erase aus E.coli, Tn5 (GenBank Acc.-No: 
U00004 Position 1401-2300; Beck et al. (1982) Gene 19 
327-336) .Daruber hinaus kann auch das aphA-6 Gen aus Acineto- 
bacter bavmaimii, kodierend fur eine Aminoglykosidphospho- 
transf erase, als Selektionsmarker genutzt werden (Huang 
et al. (2002) Mol Genet Genomics 268:19-27). 

das DOG^l-Gen. Das Gen DOG*! wurde aus der Hefe Saccharomyces 
cerevisiae isoliert (EP 0 807 836) . Es codiert fur eine 
2-Desoxyglukose-6-phosphat Phosphatase, die Resistenz 
gegenuber 2-DOG verleiht (Randez-Gil et al. 1995, Yeast 11, 
1233-1240; Sanz et al. (1994) Yeast 10:1195- 1202, Sequenz: 
GenBank Acc . -No . : NC001140 chromosom VIII, Saccharomyces 
cervisiae Position 194799-194056). 

Sulfonylurea- und Imidazolinon inaktivierende Acetolactat- 
synthasen, die eine Resistenz gegen Imidazolinon/Sulfonyl- 
urea-Herbizide verleihen. Beispielhaft seien fur Imidazoli- 
non-Herbizide die Wirkstoffe Imazamethabenz -methyl , Imazza- 
mox, Imazapyr, Imazaquin, Imazethapyr zu nennen. Fur Sulfon- 
ylharnstoff-Herbizide seien beispielhaft Amidosulf oron, Azim- 
sulfuron, Chlorimuronethyl , Chlorsulfuron, Cinosulfuron, 
Imazosulforon, Oxasulforon, Prosulforon, Rimsulforon, Sulfo- 
sulforon zu nennen. Dem Fachmann sind zahlreiche weitere 
Wirkstoffe der genannten Klassen bekannt. Geeignet sind 
Nukleinsauresequenzen wie beispielsweise die unter der Gen- 
Bank Acc-No.: X51514 abgelegte Sequenz fur das. Arabidopsis 
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thaliana Csr 1.2 Gen {EC 4.1.3.18) (Sathasivan K et al. 
(1990) Nucleic Acids Res. 18(8):2188). Acetolactatesynthasen, 
die eine Resistenz gegen Imidazolinon-Herbizide verleihen, 
sind ferner beschrieben unter den GenBank Acc.-No.: 

S 

a) AB049823 Oryza sativa ALS mRNA for acetolactate synthase, 
complete cds, herbicide resistant biotype 



b) AF094326 Bassia scoparia herbicide resistant acetolactate 
synthase precursor (ALS) gene, complete cds 

c) X07645 Tobacco acetolactate synthase gene, ALS SuRB 
(EC 4.1.3.18) 

d) X07644 Tobacco acetolactate synthase gene, ALS SuRA 
(EC 4.1.3.18) 

e) A19547 Synthetic nucleotide mutant acetolactate synthase 

f ) A19546 Synthetic nucleotide mutant acetolactate synthase 

g) A19545 Synthetic nucleotide mutant acetolactate synthase 

h) 105376 Sequence 5 from Patent EP 0257993 

i) 105373 Sequence 2 from Patent EP 0257993 



j) AL133315 



30 - Hygromycinphosphotransferasen (X74325 P. pseudomallei gene 
for hygromycin phosphotransferase) die eine Resistenz gegen 
das Antibiotikum Hygromycin verleihen. Das Gen ist Bestand- 
teil zahlreicher Expressionsvektoren und kann unter Ver- 
wendung von dent Fachmann gelaufigen Verfahren (wie beispiels- 

35 weise Polymerasekettenreaktion) aus diesen isoliert werden 

(AF294981 pINDEX4; AF234301 pCAMBIA-1380; AF234300 pCAM- 
BIA-1304; AF234299 pCAMBIA-1303 ; AF234298 pCAMBIA-1302 ; 
AF354046 pCAMBIA-1305 . ; AF354045 pCAMBIA-1305 . 1) 



40 - Resistenzgene gegen 



a) Chloramphenicol (Chloramphenicolacetyl transferase) , 

b) Tetracyclin, verschiedene Resistenzgene sind beschrieben 
45 z.B. X65876 S. Ordonez genes class D tetA and tetR 

for tetracycline resistance and repressor proteins 
X51366 Bacillus cereus plasmid pBC16 tetracycline 
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resistance gene. Zudem ist das Gen bereits Bestandteil 
zahlreicher Expressionsvektoren und kann unter Verwendung 
von dem Fachmann gelaufigen Verfahren {wie beispielsweise 
Polymerasekettenreaktion) aus diesen isoliert werden 

5 

c) Streptomycin, verschiedene Resistenzgene sind beschrieben 
z.B. mit der GenBank Acc . -No . :AJ278607 Corynebacterium 
acetoacidophilum ant gene for streptomycin adenylyl- 
transf erase. 

10 

d) Zeocin, das entsprechende Resistenzgen ist Bestandteil 
zahlreicher Klonierungsvektoren (z.B. L36849 Cloning 
vector pZEO) und kann unter Verwendung von dem Fachmann 
gelaufigen Verfahren (wie beispielsweise Polymerase- 

15 kettenreaktion) aus diesen isoliert werden. 

e) Ampicillin ( (J-Lactamase Gen? Datta N, Richmond MH. 
(1966) Biochem J. 98(l):204-9; Heffron F et al (1975) 
J. Bacteriol 122: 250-256; das Amp Gen wurde zuerst zur 

20 Herstellung des E. coli Vektors pBR322 kloniert; Bolivar 

F et al. (1977) Gene 2:95-114). Die Sequenz ist Bestand- 
teil zahlreicher Klonierungsvektoren und kann unter Ver- 
wendung von dem Fachmann gelaufigen Verfahren (wie bei- 
spielsweise Polymerasekettenreaktion) aus diesen isoliert 

25 werden. 

Gene wie die Isopentenyltransf erase aus Agrobakterium 
tumefaciens (strain: P022 ) (Genbank Acc . -No . : AB025109) . Das 
ipt Gen ist ein Schlusselenzym der Cytokinin-Biosynthese . 

30 Seine Uberexpression erleichtert die Regeneration von 

Pflanzen (z.B. Selektion auf Cytokinin-f reiem Medium). 
Das Verfahren zur Nutzung des ipt Gens ist beschrieben 
(Ebinuma H et al. (2000) Proc Natl Acad Sci USA 94:2117-2121; 
Ebinuma, H et al. (2000) Selection of Marker-free transgenic 

35 plants using the oncogenes (ipt, rol A, B, C) of Agro- 
bakterium as selectable markers. In Molecular Biology of 
Woody Plants. Kluwer Academic Publishers). 

Verschiedene weitere positive Selektionsmarker , die den trans- 
40 formierten Pflanzen einen Wachstumsvorteil gegenuber nicht-trans- 
formierten verleihen, sowie Verfahren zu ihrer Verwendung sind 
u.a. beschrieben in EP-A 0 601 092. Beispielhaft sind zu nennen 
^Glucuronidase (in Verbindung mit z.B. Cytokininglucuronid) , 
Mannose-6-phosphat-Isomerase (in Verbindung mit Mannose) , UDP-^ 
45 Galaktose-4-Epimerase (in Verbindung mit z.B. Galactose), wobei 
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Mannose-6-phosphat-Isomerase in Verbindung rait Mannose besonders 
bevorzugt ist. 

Fur einen in Plastiden funktionellen Selektionsmarker sind ins- 
5 besondere solche bevorzugt, die eine Resistenz gegen Spectino- 
mycin, Streptomycin, Kanamycin, Lincomycin, Gentamycin, Hygro- 
mycin, Methotrexat, Bleomycin, Phleomycin, Blasticidin, Sulfon- 
amid,, Phosphinotricin, Chlor sulfur on, Bromoxymil, Glyphosat, 
2,4Datrazin, 4-methyltryptophan, Nitrat, S-aminoethyl-L-cysteine, 
10 Lysin/Threonin, Aminoethyl-Cystein oder Betainaldehyd verleihen. 
Besonders bevorzugt sind die Gene aadA, nptll, BADH, FLARE-S 
(eine Fusion aus aadA und GFP, beschrieben bei Khan MS & Maliga 
P, 1999 Nature Biotech 17: 910-915). 

15 Als in Plastiden funktionelle Selektionsmarker ist vor allem das 
aadA Gen beschrieben (Svab Z und Maliga P (1993) Proc Natl Acad 
Sci USA 90:913-917). Ferner beschrieben sind modifizierte 16S 
rDNA, das nptll Gen (Kanamycinresistenz) und das bar Gen (Phos- 
phinothricinresistenz) . Aufgrund der Bevorzugung des Selektions- 

20 marker aadA wird dieser bevorzugt "recycled" d.h. nach seiner 
Verwendung aus dem Genom bzw. Plastom deletiert (Fischer N et al. 
(1996) Mol Gen Genet 251:373-380; Corneille S et al. (2001) Plant 
J 27:171- 178), so dass aadA in weiteren Trans format ionen einer 
bereist transplastomen Pflanze wieder als Selektionsmarker be- 

25 nutzt werden kann. Als weiterer moglicher Selektionsmarker ist 
die Betaine-aldehyd-Dehydrogenase (BADH) aus Spinat beschrieben 
(Daniell H et al. (2001) Trends Plant Science 6:237-239; Daniell 
H et al.( 2001) Curr Genet 39:109-116; WO 01/64023; WO 01/64024; 
WO 01/64850) . Auch lethal wirkende Agenzen wie beispielsweise 

30 Glyphosat kSnnen in Verbindung mit entsprechend detoxifizierenden 
oder resistenten Enzymen genutzt werden (WO 01/81605). 

Es konnen auch binding type marker genutzt werden. Beispiels- 
weise, kannen an einer Stella der 23SrDNA (Position 2073 oder 

35 2074 der 23SrRNA aus Tabak, Sequenz: AAAGACCCTATGAAG ) Punktmuta- 
tionen eingefiihrt werden (z.B. Sequenz: gGAGACCCTATGAAG) , die den 
aus einer so mutierten 2 3 SrDNA abgeleiteten Ribosomen Resistenz 
gegenuber Lincomycin vermitteln (Csepld A et al. (1988) Mol Gen 
Genet 214:295-299). Weitere Punktmutation umfassen solche in der 

40 16S rRNA von Tabak, die Resistenz gegenuber Spectinomycin ver- 
leihen (Mutation unterstrichen) : 

a) 5 ' -GGAAGGTGAGGATGQ-3 ' ("nativ" hier: A) 



45 Andere Mutationen in die 16S rRNA verleihen eine Resistenz gegen 
Streptomycin: 
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b) 5 ' -GAATGAAACTA-3 ' ("nativ" hier: C) 

1.2 Negative Selektionsmarker 

5 Negative Selektionsmarker ermoglichen beispielsweise die 

Selektion von Organismen mit erfolgreich deletierten Sequenzen, 
die das Markergen umfassen (Koprek T et al. (1999) The Plant 
Journal 19 (6) :719-726) . Beispielsweise kdnnen fiir Rekombinasen, 
Selektionsmarker oder far DSBI-Enzyme kodierende Sequenzen nach 
10 erfolgreicher Anwendung des erfindungsgeraaSen Verfahrens wieder 
aus dem Genom/Plastom deletiert werden. 

Bei der negativen Selektion wird beispielsweise durch den in die 
Pflanze eingebrachten negativen Selektionsmarker eine Verbindung, 

15 die ansonsten fiir die Pflanze keine nachteilige Wirkung hat, in 
eine Verbindung mit nachteiliger Wirkung umgesetzt. Ferner sind 
Gene geeignet, die per se eine nachteilige Wirkung haben, wie zum 
Beispiel TK thymidine kinase (TK) und Diphtheria Toxin A Fragment 
(DT-A) , das codA Genprodukt kodierend fiir eine Cytosindeaminase 

20 (Gleave AP et al. (1999) Plant Mol Biol 40 (2) :223-35; Perera RJ 
et al. (1993) Plant Mol Biol 23(4): 793-799; Stougaard J (1993) 
Plant J 3:755-761), das Cytochrom P450 Gen (Koprek et al. (1999) 
Plant J. 16:719-726), Gene kodierend fiir eine Haloalkan Dehalo- 
genase (Naested H (1999) Plant J. 18:571-576), das iaaH Gen 

25 (Sundaresan V et al. (1995) Genes & Development 9:1797-1810) oder 
das tms2 Gen (Fedoroff NV & Smith DL (1993) Plant J 3:273-289). 

Die jeweils fur die Selektion verwendeten Konzentrationen 
der Antibiotika, Herbizide, Biozide oder Toxine miissen an die 
30 jeweiligen Testbedingungen bzw. Organismen angepasst werden. 

Beispielhaft seien fiir Pflanzen zu nennen Kanamycin (Km) 50 mg/L, 
Hygromycin B 40 mg/L, Phosphinothricin (Ppt) 6 mg/L, Sepctino- 
mycin (Spec) 500 mg/L. 

35 Ferner kdnnen funktionelle Analoga der genannten NukleinsSuren 
kodierend fiir Selektionsmarker exprimiert werden. Funktionelle 
Analoga meint hier all die Sequenzen, die im wesentlichen die 
gleiche Funktion haben d.h. zu einer Selektion trans formierter 
Organismen befahigt sind. Dabei kann das funktionelle Analogon 

40 sich in anderen Merkmalen durchaus unterscheiden. Es kann zum 
Beispiel eine hohere oder niedrigere Aktivitat haben oder auch 
iiber weitere Funktionalitaten verfiigen. 

Funktionelle Analoga meint ferner Sequenzen, die fur Fusions- 
45 proteine kodieren bestehend aus einem der bevorzugten Selektions- 
marker und einem anderen Protein zum Beispiel einem weiteren be- 
vorzugten Selektionsmarker, einem der unten genannten Reporter- 
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proteine oder einer PLS. Beispielhaft sei eine Fusion des GFP 
(griin f luoreszierenden Proteins) und des aadA Gens genannt 
(Sidorov VA et al. (1999) Plant J 19:209-216). 

5 2. Reportergene 

Reportergene kodieren fur leicht quantif izierbare Proteine, die 
iiber Eigenfarbe oder Enzymaktivitat eine Bewertung der Trans- 
formationseffizienz, des Expressionsortes oder -2eitpunktes oder 
10 die Identifizierung transgener Pflanzen gewahrleisten. Ganz be- 
sonders bevorzugt sind dabei Gene kodierend fur Reporter-Proteine 
(siehe auch Schenborn E, Groskreutz D. Mol Biotechnol. 1999; 
13(1) : 29-44) wie 

15 - "green fluorescence protein" (GFP) (Chui WL et al., Curr 
Biol 1996, 6:325-330; Leffel SM et al., Biotechniques. 
23(5):912-8, 1997; Sheen et al. (1995) Plant Journal 
8(5) -.777-784; Haseloff et al. (1997) Proc Natl Acad Sci 
USA 94(6) -.2122-2127, • Reichel et al.(1996) Proc Natl Acad 

20 Sci USA 93(12) : 5888-5893; Tian et al. (1997) Plant Cell Rep 

16:267-271; WO 97/41228). 

Chloramphenicoltransf erase, 

25 - Luzif erase (Millar et al., Plant Mol Biol Rep 1992 

10:324-414; Ow et al. (1986) Science, 234:856-859); erlaubt 
Bi olumine s cenz de tekt i on . 

(3-Galactosidase, kodiert fur ein Enzym far das verschiedenen 
30 chromogene Substrate zur Verfugung stehen. 

{^-Glucuronidase (GUS) (Jefferson et al., EMBO J. 1987, 6, 
3901-3907) oder das uidA Gen, das ein Enzym fur verschiedene 
chromogene Substrate kodiert. 

35 

R-Locus Genprodukt: Protein, das die Produktion von Antho- 
cyaninpigmenten (rote Farbung) in pflanzlichen Gewebe regu- 
liert und so eine direkte Analyse der Promotoraktivitat ohne 
Zugabe zusatzlicher Hilfsstoffe oder chromogener Substrate 
40 ermoglicht (Dellaporta et al.. In: Chromosome Structure and 

Function: Impact of New Concepts, 18th Stadler Genetics 
Symposium, 11:263-282, 1988). 

p-Lactamase (Sutcliffe (1978) Proc Natl Acad Sci USA 
45 75:3737-3741), Enzym fur verschiedene chromogene Substrate 

(z.B. PADAC, eine chromogenes Cephalosporin) . 
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xylE Genprodukt (Zukowsky et al. (1983) Proc Natl Acad Sci 
USA 80:1101-1105), Catecholdioxygenase, die chromogene Cate- 
chole umsetzen kann. 

5 - Alpha-Amylase {Ikuta et al. (1990) Bio/technol. 8:241-242). 

- Tyrosinase (Katz et al.(1983) J Gen Microbiol 129:2703-2714), 
Enzym, das Tyrosin zu DOPA und Dopaquinon oxidiert, die in- 
folge das leicht nachweisbare Melanin bilden. 

10 

Aequorin (Prasher et al. (1985) Biochem Biophys Res Commun 
126 (3) :1259-1268) , kann in der Calcium-sensitiven Biolumine- 
scenzdetektion verwendet werden. 

15 Der Selektionsmarker bzw. das Reportergen ist bevorzugt auf dem 
RE- bzw- RE/DSB-Konstrukt und/ oder Transformationskonstrukt, be- 
sonders bevorzugt auf der Insertionssequenz kodiert. Er kann aber 
auch auf einem unabhangigen Transformationskonstrukt kodiert 
sein, welches in einer Co-Transformation mit dem Transformations- 

20 konstrukt von Interesse in den Kern oder die Plastiden einer 
Pflanzenzelle eingebracht wird. 

Die erfindungsgemaSen Transformationsvektoren und Insertions- 
sequenzen konnen weiteren Funktionselemente enthalten. Der 

25 Begriff der weiteren Funktionselemente ist breit zu verstehen. 
Bevorzugt sind all solche Elemente gemeint, die einen Einfluss 
auf Herstellung, Vermehrung, Funktion, Nutzen oder Wert der im 
Rahmen des erf indungsgemaSen Verfahrens zum Einsatz kommenden 
Insertionssequenzen, Transf ormationskonstrukte- oder -vektoren 

30 haben. Beispielhaft jedoch nicht einschrankend seien far die 
weiteren Funktionselemente zu nennen: 

i. Replikationsursprunge (ORI; origin of DNA replication) , die 
eine Vermehrung der erfindungsgemaSen Expressionskassetten 

35 oder Vektoren in zum Beispiel E. coli oder aber auch in 

Plastiden gewahrleisten. Beispielhaft fur E.coli ORIs seien 
genannt der pBR322 ori, der P15A ori (Sambrook et al.: Mole- 
cular Cloning. A Laboratory Manual, 2"* ed. Cold Spring Harbor 
Laboratory Press, Cold Spring Harbor, NY, 1989) oder der 

40 colEl-ORI beispielsweise aus pBLUESCRIPT. Plastidare ORI sind 

beschrieben in US 5,693,507, US 5,932,479 oder WO 99/10513. 

ii. Multiple Klonierungsregionen (MCS) erlauben und erleichtern 
die Insertion eines oder mehrerer Nukleinsauresequenzen . 

45 
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iii. Seguenzen, die eine homologe Rekombination bzw. Insertion 
in das Genom bzw. Plastora eines Wirtsorganismus ermoglichen. 

iv. Elemente zum Beispiel "Border seguenzen", die einen Agro- 
5 bakterien-vermittelte Transfer in Pf lanzenzellen fur die 

tjbertragung und Integration ins Pf lanzengenom ermSglichen, 
wie zum Beispiel die rechte oder linke Begrenzung der T-DNA 
oder die vir-Region. 

10 Die Einfuhrung einer Insertionssequenz oder eines Expressions- 
konstruktes - beispielsweise fur eine Rekombinase, ein DSBI-Enzym 
oder einen Selektionsmarker - kann vorteilhaft unter Verwendung 
von Vektoren realisiert werden, in die diese Konstrukte bzw. 
Kassetten insertiert werden. Vektoren kennen beispielhaft 

15 Plasmide, Cosmide, Phagen, Viren, Retroviren oder auch Agro- 
bacterien sein. 

In einer vorteilhaften Ausfiihrungsf orm wird die Einfuhrung der 
Expressionskassette mittels Plasmidvektoren realisiert. Bevor- 
20 zugt sind solche Vektoren, die eine stabile Integration der 

Expressionskassette in das Wirtsgenom bzw. -plastom ermSglichen. 

Die Herstellung eines trans formiert en Organismus oder einer 
trans formier ten Zelle erfordert, dass die entsprechende DNA 

25 in die entsprechende Wirtszelle bzw. in die Plastiden derselben 
eingebracht wird. Fiir diesen Vorgang, der als Transformation 
bezeichnet wird, stent eine Vielzahl von Methoden zur Ver- 
fugung (siehe auch Keown et al . (1990) Methods in Enzymology 
185:527-537). So kann die DNA beispielhaft direkt durch Mikroin- 

30 jektion, Elektroporation oder durch Bombardierung mit DNA-be- 

schichteten Mikropartikeln eingefixhrt werden. Auch kann die Zelle 
chemisch, zum Beispiel mit Polyethylenglycol , permeabilisiert 
werden, so dass die DNA durch Diffusion in die Zelle gelangen 
kann. Die Transformation kann auch durch Fusion mit anderen DNA- 

35 enthaltenden Einheiten wie Minicells, Zellen, Lysosomen oder 

Liposomen erfolgen. Zu nennen sind ferner die Transfektion unter 
Einsatz von Calciumphosphat , DEAE-Dextran oder kationischen 
Lipiden, Transduktion, Infektion, die Inkubation trockener 
Embryonen in DNA-haltiger LSsung, die Sonikation sowie die Trans- 

40 formation intakter Zellen oder Gewebe durch Mikro- oder Makro- 
in jektion in Gewebe oder Embryonen, Gewebeelektroporation oder 
die Vakuuminfiltration von Samen. Derartige Verfahren sind dera 
Fachmann gelaufig. Im Falle von In jektion oder Elektroporation 
von DNA in pflanzliche Zellen sind keine besonderen Anforderungen 

45 an das verwendete Plasmid gestellt. Einfache Plasmide wie die der 
pUC-Reihe k6nnen verwendet werden. Sollen vollstandige Pflanzen 
aus den trans formier ten Zellen regeneriert werden, . so ist es 
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niitzlich, das sich auf dem Plasmid ein zusatzliches selektionier- 
bares Markergen befindet. Auch die Verfahren zur Regeneration 
von Pflanzen aus Pf lanzengeweben oder Pf lanzenzellen sind be- 
schrieben. 

5 

Es gibt verschiedene Moglichkeiten, die DNA in die Plastiden 
einzuschleusen. Fur die vorliegende Erfindung ist lediglich 
entscheidend, dass die DNA in die Plastiden eingebracht wird. 
Die vorliegende Erfindung ist jedoch nicht limitiert auf ein 

10 bestinrmtes Verfahren. Jedes Verfahren, das ein Einbringen der 
zu trans formierenden DNA in die Plastiden einer hoheren Pflanze 
erlaubt, ist geeignet. Die stabile Transformation von Plastiden 
ist ein dem Fachmann gelaufiges Verfahren und wurde fur hehere 
Pflanzen beschrieben (u.a. bei Svab Z und Maliga P (1993) Proc 

15 Natl Acad Sci USA 90 (3) : 913-917) . Die Methoden beruhen zum Bei- 
spiel auf einer Transformation mittels "Particle Gun" und einer 
Insertion in das plastidare Genom durch homologe Rekombination 
unter Selektionsdruck. Weitere Methoden sind beschrieben in 
US 5,877,402. In EP-A 0 251 654 wird die DNA mittels Agro- 

20 bakterium tumefaciens eingefuhrt (s. De Block Met al. (1985) 
EMBO J 4:1367-1372; Venkateswarlu K und Nazar RN (1991) Bio/ 
Technology 9:1103-1105). Ferner wurde gezeigt, dass man mittels 
Elektroporation DNA in isolierte Chloroplasten einbringen und so 
eine transiente Expression erzielen kann (To KY et al. (1996) 

25 Plant J 10:737-743). Bevorzugt ist eine Transformation mittels 
eines direkten Transfers der DNA in Plastiden von Protoplasten 
beispielsweise unter Verwendung von PEG (Polyethylenglykol) (Koop 
HU et al. (1996) Planta 199:193-201? Kofer W et al. (1998) In Vi- 
tro Cell Dev Biol Plant 34:303-309; Dix PJ und Kavanagh TA (1995) 

30 Euphytica. 85:29-34; EP-A 0 223 247). Am meisten bevorzugt sind 
biolistische Transformationsverfahren. Dabei wird die zu trans- 
formierende DNA auf z.B. Gold- oder Wolf rampartikel aufgebracht. 
Diese Partikel werden anschlieSend auf das zu trans formierende 
Explantat beschleunigt (Dix PJ und Kavanagh TA (1995) Euphytica. 

35 85:29-34; EP-A 0 223 247). AnschlieSend werden in der dem Fach- 
mann gelaufigen Weise transplastome Pflanzen unter Selektions- 
druck auf geeignetem Medium regeneriert. Entsprechende Verfahren 
sind beschrieben (z.B. US 5,451,513; US 5,877,402; Svab Z et al. 
(1990) Proc Natl Acad Sci USA 87:8526-8530; Svab Z und Maliga P 

40 (1993) Proc Natl Acad Sci USA 90:913-917). Daruber hinaus kann 
die DNA mittels Mikroinjektion in die Plastiden eingebracht 
werden. Ein besonderes Verfahren der Mikroinjektion wurde 
kurzlich beschrieben (Knoblauch M et al. (1999) Nature Biotech 
17:906-909; van Bel AJE et al. (2001) Curr Opin Biotechnol 

45 12:144-149). Dieses Verfahren ist fur die vorliegende Erfindung 
besonders bevorzugt. Es ist auch moglich, durch Protoplasten- 
fusion die Plastiden aus einer Art in eine andere Art einzu- 
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bringen, diese dort zu trans formieren und anschlieSend durch 
Protoplastenfusion diese wieder in die urspriingliche Art zu 
uberfuhren (WO 01/70939). 

5 Neben diesen "direkten" Transf ormationstechniken kann eine Trans- 
formation auch durch bakterielle Infektion mittels Agrobakterium 
tumefaciens oder Agrobakterium rhizogenes durchgefuhrt werden 
(Horsch RB (1986) Proc Natl Acad Sci USA 83 (8) :2571-2575; Fraley 
et al. (1983) Proc Natl Acad Sci USA 80:4803-4807; Bevans et al. 

10 (1983) Nature 304:184-187). Die Expressionskassette beispiels- 
weise fur das DSBI-Enzym wird bevorzugt in spezielle Plasmide 
integriert, entweder in einen Zwischenvektor (englisch: shuttle 
or intermediate vector) oder einen binaren Vektor. Bevorzugt 
werden binare Vektoren verwendet. Binare Vektoren konnen sowohl 

15 in E. coli als auch in Agrobakterium replizieren und konnen 
direkt in Agrobakterium transf ormiert werden (Holsters et al. 
(1978) Mol Gen Genet 163:181-187). Verschiedene binare Vektoren 
sind bekannt und teilweise kommerziell erhaltlich wie zum Bei- 
spiel pBIN19 (Clontech Laboratories, Inc. USA; Bevan et al. (1984) 

20 Nucl Acids Res 12:8711). Das Selektionsmarkergen erlaubt eine 
Selektion trans formierter Agrobakteria und ist zum Beispiel 
das nptll Gen, das eine Resistenz gegen Kanamycin verleiht. 
Das Binarplasmid kann beispielsweise durch Elektroporation 
oder andere Transf ormationsmethoden in den Agrobakterienstamm 

25 Obertragen werden (Mozo & Hooykaas 1991, Plant Mol. Biol. 16, 
917-918) . Die Cokultur der pflanzlichen Explantate itdt dem 
Agrobakterienstamm findet in der Regel fur zwei bis drei Tage 
statt. Das in diesem Fall als Wirtsorganismus fungierende Agro- 
bakterium sollte bereits ein Plasmid mit der vir-Region ent- 

30 halten. Viele Stamme von Agrobakterium tumefaciens sind in 
der Lage, genetisches Material zu iibertragen, wie z.B. die 
Stamme EHA101 [pEHAlOl] (Hood EE et al. (1996) J Bacteriol 
168(3) :1291-1301) , EHA105 [ P EHA105] (Hood et al. (1993) Transgenic 
Research 2:208-218), LBA4404 [pAL4404] (Hoekema et al. (1983) 

35 Nature 303:179-181), C58Cl[pMP90] (Koncz and Schell (1986) Mol 
Gen Genet 204:383-396) und C58C1 [pGV2260] (Deblaere et al. (1985) 
Nucl Acids Res 13: 4777-4788). 

Fur den Transfer der DNA auf die pflanzliche Zelle werden pflanz- 
40 liche Explantate mit Agrobakterium tumefaciens oder Agrobakterium 
rhizogenes kokultiviert . Ausgehend von infiziertem Pflanzen- 
material (z.B. Blatt-, Wurzel- oder Stengelteile, aber auch 
Protoplasten oder Suspensionen von Pf lanzenzellen) k6nnen ganze 
Pflanzen unter Verwendung eines geeigneten Mediums, dass zum 
45 Beispiel Antibiotika oder Biozide zur Selektion transf ormiert en 
Zellen enthalten kann, regeneriert werden. Ein mittrans formierter 
Selektionsmarker erlaubt die Selektion von. transf ormierten Zellen 
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von untransformierten (McCormick et al. (1986) Plant Cell 
Reports 5:81-84). Die erhaltenen Pflanzen konnen in ublicher 
Weise geztichtet, geselbstet und gekreuzt werden. Zwei oder mehr 
Generationen sollten kultiviert werden, urn sicherzustellen, 
5 dass die genomische Integration stabil und vererblich ist. Die 
genannten Verfahren sind beispielsweise beschrieben bei Jenes B 
et al. (1993) Techniques for Gene Transfer, in: Transgenic 
Plants, Vol. 1, Engineering and Utilization, herausgegeben von 
Rung SD und Wu R, Academic Press, S. 128-143 sowie bei Potrykus 
10 (1991) Ann Rev Plant Physiol Plant Molec Biol 42:205-225). 

Die Agrobakterium-vermittelte Transformation ist am besten fur 
dicotyledone Pf lanzenzellen geeignet, wohingegen die direkten 
Transformationstechniken sich fur jeden Zelltyp eignen. 

15 

Die Agrobakterium-vermittelte Transformation wird besonders be- 
vorzugt far die Kerntransformation, die direkten Transformations- 
techniken besonders bevorzugt fur die Plastidentransformation 
eingesetzt. 

20 

Sobald eine uberwiegend homotransplastome Pf lanzenzelle nach dem 
erfindungsgemafien Verfahren hergestellt wurde, kann eine voll- 
standige Pflanze unter Verwendung von dem Fachmann bekannten Ver- 
fahren erhalten werden. Hierbei geht man beispielhaft von Kallus- 
25 kulturen aus. Aus diesen noch undif ferenzierten Zellmassen kann 
die Bildung von Spross und Wurzel in bekannter Weise induziert 
werden. Die erhaltenen Sprosslinge konnen ausgepflanzt und ge- 
ztichtet werden. 



30 Deletionsverfahren 

Bei den beschriebenen erf indungsgemaSen Verfahren ist es auf 
verschiedenen Stufen vorteilhaft, bestimmte zuvor eingefuhrte 
Sequenzen (beispielsweise fur Selektionsmarker, Rekombinasen 

35 und/oder DSBI -Enzyme) wieder aus dem Plastom oder Genom der 
Pflanze oder Zelle zu entfernen. So ist es ist von Vorteil aber 
nicht zwingend erforderlich, den Selektionsmarker, der beispiels- 
weise bei der Insertion einer nicht-natiirlichen RE-Sequenz 
und/oder DBS-Erkennungssequenz eingefuhrt wurde, aus der Master- 

40 pflanze wieder zu entfernen, weil dann in einer nachf olgenden 
Transformation (z.B. mit der Insertionssequenz) wieder der 
gleiche Selektionsmarker genutzt werden kann. Eine Deletion 
ist insbesondere vorteilhaft, da der Selektionsmarker nach der 
Selektionsphase nicht mehr unbedingt erforderlich und daher ttber- 

45 flussig ist. Die Deletion erhoht zudem die Verbraucherakzeptanz 
und ist unter zulassungstechnischen Uberlegungen wunschenswert . 
Zudem wird der Proteinsyntheseapparat des Plastides nicht unnStig 
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durch die Synthese des Markerproteins belastet, was sich poten- 
tiell vorteilhaft auf die Eigenschaf ten der entsprechenden 
Pflanze auswirkt. 

5 Zur gezielten Deletion von Sequenzen sind dem Fachmann ver- 
schiedenen Verfahren bekannt. Zu nennen ist beispielsweise 
jedooh nicht einschrankend die Excision mittels Rekombinasen. 
Verschiedene sequenzspezifische Rekombinationssystemen sind be- 
schrieben wie das Cre/lox-System des Bacteriophagen Pi (Dale EC 

10 und Ow DW (1991) Proc Natl Acad Sci USA 88:10558-10562; Russell 
SH et al. (1992) Mol Gen Genet 234: 49-59; Osborne BI et al. 
(1995) Plant J. 7, 687-701), das FLP/FRT System der Hefe (Kilby 
NJ et al. (1995) Plant J 8:637-652; Lyznik LA et al. (1996) Nu- 
cleic Acids Res 24:3784-3789), die Gin Rekombinase des Mu Phagen, 

15 die Pin Rekombinase aus E. coli oder das R/RS System des pSRl 
Plasmids (Onouchi H et al. (1995) Mol Gen Genet 247:653-660; 
Sugita K et al. (2000) Plant J 22:461-469). Diese Verfahren sind 
nicht nur fur die Deletion von DNA Sequenzen aus dem Kerngenom, 
sondern auch aus dem Plastom nutzbar (Corneille et al. (2001) 

20 Plant J 27: 171-178; Hajdukieicz et al. (2001) Plant J 

27:161-170). Als weitere Rekombinasen konnen beispielsweise 
eingesetzt werden: PhiC31 (Kuhstoss & Rao (1991) J Mol Biol 
222:897-908), TP901-1 (Christiansen et al. (1996) J Bacterid 
178:5164-5173), xisF aus Anabaena (Ramaswamy et al. (1997) Mol 

25 Microbiol 23:1241-1249), Integrase vom Phagen PhiLC3 (Lillehaug 
et al. (1997) Gene 188:129-136) oder die Rekombinase kodiert 
vom sre Gen des R4-Phagen (Matsuura et al. (1996) J Bacteriol 
178:3374-3376) . 

30 In einer bevorzugten Aus fuhrungs form wird die Deletion jedoch 

durch intramolekulare (z.B. intrachromosomale ) Rekombination auf- 
grund von entsprechend eingebrachten Sequenzduplikationen reali- 
siert. Letzteres kann durch das gezielte Einfuhren von Doppel- 
strangbruchen nahe der Sequenz-Duplikationen in seiner Effizienz 

35 gesteigert werden (vgl. Fig. 8). Dazu wird die zu deletierende 
Sequenz beidseitig von Homologiesequenzen HI und H2 flankiert, 
die eine ausreichende LSnge und Homologie aufweisen, um mitein- 
ander zu rekombinieren . Die Rekombination wird durch die Induk- 
tion mindestens eines sequenzspezifischen Doppelstrangbruch.es 

40 nahe einer der beiden Homologiesequenzen gelegenen DSB-Erken- 

nungssequenz induziert. Bevorzugt ist diese DSB-Erkennungssequenz 
zwischen den beiden Homologiesequezen lokalisiert. Zur Induktion 
des Doppelstrangbruches wird bevorzugt ein DSBI-Enzym exprimiert 
oder eingebracht. Besonders bevorzugt wird dieses Verfahren zur 

45 Deletion von Selektionsmarkern aus dem Plastom genutzt. 
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Ein anderer Gegenstand der Erfindung betrifft die mit dem 
erfindungsgemafcen Verfahren hergestellten transplastomen, 
uberwiegend homoplastomen Pflanzen, sowie Teile derselben wie 
Blatter, Wurzeln, Samen, Fruchte, Knollen, Pollen oder Zell- 
5 kulturen, Kallus usw. - abgeleitet von solchen. 

Ein anderer Gegenstand der Erfindung betrifft die in dem 
erfindungsgemaSen Verfahren zum Einsatz kommenden Pflanzen, 
die eine erf indungsgemaSe Expressionskassette fur ein Fusion- 

10 sprotein aus einer PLS und einer Rekombinase der Familie der . 

Resolvasen/Invertasen unter Kontrolle eines im pflanzlichen Zell- 
kern funktionellen Promoters enthalten. Besonders bevorzugt liegt 
die Expressionskassette stabil integriert in die nukleare DNA 
vor. Umfasst sind ferner Teile derselben wie Blatter, Wurzeln, 

15 Samen, Knollen, Fruchte, Pollen oder Zellkulturen, Kallus usw. - 
abgeleitet von solchen Pflanzen. 

Ein weiterer Gegenstand der Erfindung betrifft Expressions- 
kassetten, die Nukleinsauresequenzen kodierend fur Rekombinasen 

20 der Familie der Resolvasen/Invertasen unter Kontrolle eines 
in pflanzlichen Plastiden funktionellen Promotors enthalten. 
Besonders bevorzugt liegt die Expressionskassette stabil inte- 
griert in das Plastom vor. Umfasst sind ferner Teile derselben 
wie Blatter, Wurzeln, Samen, Knollen, Fruchte, Pollen oder Zell- 

25 kulturen, Kallus usw. - abgeleitet von solchen Pflanzen. 

Von Menschen und Tieren verzehrbare erf indungsgemaSe , genetisch 
veranderte Pflanzen konnen auch beispielsweise direkt oder nach 
an sich bekannter Aufbereitung als Nahrungsmittel oder Futter- 
30 mittel verwendet werden. 

Ein weiterer Gegenstand der Erfindung betrifft die Verwendung der 
oben beschriebenen erfindungsgemaSen transplastomen, uberwiegend 
homoplastomen Pflanzen und der von ihnen abgeleiteten Zellen, 
35 Zellkulturen, Teile - wie zum Beispiel bei transgenen pflanz- 
lichen Organismen Wurzeln, Blatter etc.-, und transgenes Vermeh- 
rungsgut wie Samen oder Fruchte, zur Herstellung von Nahrungs- 
oder Futtermitteln, Pharmazeutika oder Feinchemikalien. 

40 Feinchemikalien meint Enzyme wie beispielsweise die unten genann- 
ten industriellen Enzyme, Vitamine wie beispielsweise Toco- 
pherolen und Tocotrienolen (z.B. Vitamin E) und Vitamin B2, 
Aminosauren wie beispielsweise Methionin, Lysin oder Glutamat, 
Kohlenhydrate wie beispielsweise Starke, Amylose, Amylopektin 

45 oder Saccharose, Fettsauren wie beispielsweise gesattigte, 
ungesSttigte und polyungesattigte Fettsauren, naturliche und 
synthetische Geschmacks-, Aromastoffe wie beispielsweise Linalo- 
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01. Menthol, Borneon (Kampfer) , Pinen, Limonen oder Geraniol 
und Farbstoffe wie beispielsweise Retinoide (z.B. Vitamin A), 
Flavonoide (z.B. Quercetin, Rutin, Tangeretin, Nobiletin) oder 
Carotinoide (z.B. p-Carotin, Lycopin, Astaxanthin) . Besonders 

5 bevorzugt ist die Produktion von Tocopherolen und Tocotrienolen 
sowie Carotinoiden. Die Zuchtung der transformierten Wirts- 
organismen sowie die Isolierung aus den Wirtsorganismen bzw. aus 
dem Zuchtungsmedium erfolgt mit dem Fachmann bekannten Verfahren. 
Die Produktion von Pharmazeutika, wie zum Beispiel AntikSrpern 
10 Oder Vakkzinen ist beschrieben (Hood EE, Jilka JM. (1999) Curr 
Opin Biotechnol. 10 (4) :382-386; Ma JK und Vine ND (1999) Curr Top 
Microbiol Immunol. 236: 275-92) . 

Insbesondere eignet sich das erfindungsgemafie Verfahren zur Her- 
15 stellung von industriellen Enzymen im Rahmen eines sogenannten 
" Phytof arming " . Beispielhaft jedoch nicht einschrankend seien fur 
die industriellen Enzyme zu nennen Lipasen, Esterasen, Proteasen, 
Nitrilasen, Acylasen, Epoxyhydrolasen, Amidasen, Phosphatasen , 
Xylanasen, Alkoholdehydrogenasen, Amylasen, Glucosidasen, 
20 Galactosidasen, Pullulanasen, Endocellulasen, Glucanasen, 
Cellulasen, Nukleasen, Chitindeacetylasen, Monoaminoxidasen, 
Lysozyme und Laccasen. 

Im Rahmen der Erfindung insbesondere bevorzugte Aus runnings formen 
25 werden unten im Rahmen der Erlauterungen zu den Abbildungen nSher 
beschrieben. 

Sequenzen 

30 1. SEQ ID NO: 1 

pCB42-94 Basisvektor fiir die Plastidentransf ormation. 

2. SEQ ID NO: 2 

In die Multiple Klonierungsstelle von pCB42-94 (SEQ ID NO: 1) 
35 insertierte Nukleinsauresequenz . Resultierender Vektor: 
PCB199-3. 

3. SEQ ID NO: 3 

In die Multiple Klonierungsstelle von pCB42-94 (SEQ ID NO: 1) 
40 insertierte Nukleinsauresequenz. Resultierender Vektor: 

PCB401-20 

4. SEQ ID NO: 4 

Synthetische Sequenz der Homing-Endonuklease I-Ppol (ORF: 16 
45 bis 507) 
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SEQ ID NO: 5 

Proteinsequenz der Homing-Endonuklease I-Ppol 



5 



6. 



SEQ ID NO: 6 Oligonukleotid- Primer pl9 
5 ' -TAAGGCCCTCGGTAGCAACGG-3 ' 



7. SEQ ID NO: 7 Oligonukleotid-Primer p20 
5 ' -GGGGTACC AAATCCAACTAG- 3 ' 

10 8. SEQ ID NO: 8 Oligonukleotid-Primer p21: 
5 ' -GGAGCTCGCTCCCCCGCCGTCGTTC-3 ' 

9. SEQ ID NO: 9 Oligonukleotid-Primer p22 
5 ' -GATGCATGATGACTTGACGGCATCCTC-3 ' 



10. SEQ ID NO: 10 

Nukleinsauresequenz kodierend fur das Transitpeptid der 
kleine Untereinheit (SSU) der Ribulosebisphosphatcarboxylase 
(Rubisco ssu) aus Erbse 



11. SEQ ID NO: 11 

Transitpeptid der kleine Untereinheit (SSU) der Ribulose- 
bisphosphatcarboxylase (Rubisco ssu) aus Erbse 

25 12. SEQ ID NO: 12 

Transitpeptid der plastidaren Transketolase aus Tabak. 

13. SEQ ID NO: 13 

Nukleinsauresequenz kodierend far das Transitpeptid der 
30 plastidaren Transketolase aus Tabak (Leseraster 1; pTP09) 

14. SEQ ID NO: 14 

Nukleinsauresequenz kodierend fur das Transitpeptid der 
plastidaren Transketolase aus Tabak (Leseraster 2; pTPlO) 



15. SEQ ID NO: 15 

Nukleinsauresequenz kodierend fiir das Transitpeptid der 
plastidaren Transketolase aus Tabak (Leseraster 3; pTPll) 

40 16. SEQ ID NO: 16 

Transitpeptid der plastidaren Isopentenylpyrophosphat 
Isomerase-2 (IPP-2) aus Arabidopsis thaliana. 



15 



20 



35 



45 
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17. SEQ ID NO: 17 

Nukleinsauresequenz kodierend fur das Transitpeptid der 
plastidaren Isopentenylpyrophosphat Isomerase-2 (IPP-2) 
aus Arabidopsis thaliana (Leseraster 1; IPP-9) 

5 

18. SEQ ID NO: 18 

Nukleinsauresequenz kodierend fur das Transitpeptid der 
plastidaren Isopentenylpyrophosphat Isomerase-2 (IPP-2) 
aus Arabidopsis thaliana (Leseraster 2; IPP-10) 

10 

19. SEQ ID NO: 19 

Nukleinsauresequenz kodierend fur das Transitpeptid der 
plastidaren Isopentenylpyrophosphat Isomerase-2 (IPP-2) 
aus Arabidopsis thaliana (Leseraster 3; IPP-11) 

15 

20. SEQ ID NO: 20 

Nukleinsauresequenz kodierend fur den PrbcL Promotor aus 
Tabak. 

20 21. SEQ ID NO: 21 

Nukleinsauresequenz kodierend fur den Prpsl6-107 Promotor 
aus Tabak. 

22. SEQ ID NO: 22 

25 Nukleinsauresequenz kodierend fur den Prrnl6 Promotor aus 

Tabak. 

23. SEQ ID NO: 23 

Nukleinsauresequenz kodierend fur Promotor PaccD-129 aus 
30 Tabak. 

24. SEQ ID NO: 24 

Nukleinsauresequenz kodierend far den Promotor PclpP-53 aus 
Tabak. 

35 

25. SEQ ID NO: 25 

Nukleinsauresequenz kodierend fur den Promotor Prrn-62 aus 
Tabak. 

40 26. SEQ ID NO: 26 

Nukleinsauresequenz kodierend fur den Promotor Prpsl6 aus 
Tabak. 

27. SEQ ID NO: 27 
45 Nukleinsauresequenz kodierend fur den Promotor PatpB/E-290 

aus Tabak. 
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28. SEQ ID NO: 28 

Nukleinsaureseguenz kodierend fur den Promotor PrpoB-345 aus 
Tabak. 

5 29. SEQ ID NO: 29 

Nukleinsaureseguenz kodierend fur eine Sequenz abgeleitet von 
der Konsensusseguenz der a70 Promotoren aus E.coli. 

30. SEQ ID NO: 30 

10 Nukleinsaureseguenz kodierend fur die 5 ' -untranslatierte 

Region des psbA Gens aus Tabak (5'psbA) 

31. SEQ ID NO: 31 

Nukleinsaureseguenz kodierend fur die 5 '-untranslatierte 
15 Region einschliefclich 5' Anteilen aus dem kodierenden Bereich 

des rbcL Gens aus Tabak (5'rbcL) . 

32. SEQ ID NO: 32 

Nukleinsaureseguenz kodierend fur die 5 ' -untranslatierte 
20 Region des rbcLs Gens aus Tabak. 

33. SEQ ID NO: 33 

Nukleinsaureseguenz kodierend fur die 3 ' -untranslatierte 
Region des psbA-1 Gens aus Synechocystis (3'psbA-l) 

25 

34. SEQ ID NO: 34 

Nukleinsaureseguenz kodierend fur die 3 ' -untranslatierte 
Region des psbA Gens aus Tabak (3 'psbA) 

30 35. SEQ ID NO: 35 

Nukleinsaureseguenz kodierend fur die 3 ' -untranslatierte 
Region des rbcL Gens aus Tabak (3'rbcL) 

36. SEQ ID NO: 36 

35 Nukleinsauresequenz kodierend fur synthetische Ribosomen- 
bindestellen (RBS) 

37. SEQ ID NO: 37 

Nukleinsaureseguenz kodierend fur synthetische Ribosomen- 
40 bindestelle (RBS) 

38. SEQ ID NO: 38 01 igonukleot id- Primer p65: 
5 ' -ATGGATCCATATGGCCATGGCACAAGGGGTTGTG-3 ' 



45 39. SEQ ID NO: 39 Oligonukleotid-Primer p66: 
5 ' -CCCGGGCTCGAGCTGCAGCTACGCCGCTACGTC -3 ' 
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40. SEQ ID NO: 40 

Insert von Vektor pCB193-17 umfassend Expressionskassette 
kodierend fiir Fusionsprotein aus PLS und *C31 Rekombinase 

5 41. SEQ ID NO: 41 

Aminosauresequenz des Fusionsproteins aus PLS und 4>C31 
Rekombinase 

42. SEQ ID NO: 42 

10 Aminosauresequenz der *C31 Rekombinase 

43. SEQ ID NO: 43 Oligonukleotid-Primer p71: 
5 ' -TGGATCCATATGGCCATGGCTAAGAAAGTAG-3 ' 

15 44. SEQ ID NO: 44 Oligonukleotid-Primer p72: 
5 ' -CCTCGAGCTGCAGTTAAGCGAGTTGG-3 ' 

45. SEQ ID NO: 45 

Binarvektor pCB245-37 umfassend Expressionskassette kodierend 
20 fiir Fusionsprotein aus PLS und TP901-1 Rekombinase 

46. SEQ ID NO: 46 

Aminosauresequenz des Fusionsproteins aus PLS und TP901-1 
Rekombinase 

25 

47. SEQ ID NO: 47 

Aminosauresequenz der TP901-1 Rekombinase 

48. SEQ ID NO: 48 

30 Vektor pCB249-24 umfassend attP Erkennungsregion fiir die 

Rekombinase aus TP901-1 und attP Erkennungsregion fur die 
Rekombinase aus G>C31 

49. SEQ ID NO: 49 

35 Vektor pCB3 84-40 umfassend attP Erkennungsregion fur die 
Rekombinase aus TP901-1 und attP Erkennungsregion fur die 
Rekombinase aus *C31 sowie eine Expressionskassette fur die 
Homing Endonuklease I-Ppol 

40 50. SEQ ID NO: 50 Nukleinsauresequenz kodierend fur das Insert 
aus Vektor pCB456-2 

51. SEQ ID NO: 51 Oligonukleotidprimer p354 

5 ' -CGGATCCGGAGGCATCATGACTAAGAAAGTAGCAATCTATACACG 

45 
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52. SEQ ID NO: 52 Oligonukleotidprimer p355 

5 ' -ATAAGCTTTATTCTCGATATCG-3 ' 



53. SEQ ID NO: 53 Nukleinsauresequenz kodierend far das Insert 

aus Vektor pCB557-l 

54. SEQ ID NO: 54 Nukleinsauresequenz kodierend far das Insert 

aus Vektor pCB554-3 



10 55. SEQ ID NO: 55 Oligonukleotidprimer p268 

5 ' -TCGACTTGACATTCACTCTTCAATTATCTATAATGATACATG-3 ' 

56. SEQ ID NO: 56 Oligonukleotidprimer p72 

5 ' -CCTCGAGCTGCAGTTAAGCGAGTTGG-3 ' 

15 

57. SEQ ID NO: 57 Nukleinsauresequenz kodierend far PCR Produkt 

TP-Rek 



58. SEQ ID NO: 58 Nukleinsauresequenz kodierend far Southern- 

Blot Sonde 

59. SEQ ID NO: 59 Nukleinsauresequenz kodierend far eine 

Promotorsequenz abgeleitet von der 
Konsensussequenz der (570 Promotoren 
aus E.coli. 

60. SEQ ID NO: 60 Nukleinsauresequenz kodierend fur das Insert 

aus Vektor pCB487-20 umfassend Sequenz 
kodierend far TP901 Rekombinase 

61. SEQ ID NO: 61 Aminosauresequenz kodierend fur TP901 

Rekombinase 



Abbildungen 

35 

Im Rahmen des erf indungsgemaSen Verfahrens sind insbesondere die 
in nachfolgenden Abbildungen verdeutlichten Ausfahrungsf ormen 
besonders bevorzugt. Far die Abbildungen gelten allgemein nach- 
folgende Abkurzungen: 

40 

X/Y : Rekombinase Erkennungsstelle 

U/W: Rekombinase Erkennungsstelle, kann bevorzugt nicht mit 
X/Y rekombinieren 

45 
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X'/Y': Rekombinase Erkennungsstelle, kann bevorzugt nur mit X/Y 
rekombinieren 

U' /W : Rekombinase Erkennungsstelle, kann bevorzugt nur mit U/W 
5 rekombinieren 

X/Y' bzw. X'/Y: Nach Rekombination zwischen X/Y und X'/Y' her- 
vorgegangen, zwischen diesen Stellen kann die 
Rekombinase allein bevorzugt keine weiteren 
10 Rekombinationen katalysieren 

U/W bzw. U'/W: Nach Rekombination zwischen U/W und U'/W' her- 
vorgegangen, zwischen diesen Stellen kann die 
Rekombinase allein bevorzugt keine weiteren 
15 Rekombinationen katalysieren 

R, Rl, R2: Rekombinase 

A, A' Paar homologer Sequenzen A und A' 

20 

A/ A' Ergebnis einer homologen Rekombination zwischen A und A' 
und/oder eines durch Reperatursynthese bedingten Aus- 
tausches zwischen A und A' . 

25 B, B' Paar homologer Sequenzen B und B' 

B/B' Ergebnis einer homologen Rekombination zwischen B und B' 
und/oder eines durch Reperatursynthese bedingten Aus- 
tausches zwischen B und B' . 

30 

HI, H2: Paar homologer Sequenzen HI und H2 

Hl/2: Sequenz als Ergebnis der homologen Rekombination aus Hi 
und H2 

35 

DS funktionelle DSB-Erkennungssequenz 

nDS nicht funktionelle "Halbseite" einer DSB-Erkennungs- 

sequenz 



40 



DSBI-Enzym 
Promotor 



45 I: 



weitere Nukleinsauresequenz 
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S, S' Positive Selektionsmarker 
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NS Negativer Selektionsmarker 

S 1. Fig.lA/B: Einfuhrung einer RE-Sequenz in das Plastom mittels 
Doppeltem "Cross-Over" 

In einer besonders bevorzugten Ausfuhrungsf orm 1 wird zunachst 
ein RE-Konstrukt in Plastiden einer hoheren Pflanze eingebracht. 

10 Das RE-Konstrukt wird in dieser Ausfiihrungsf orm bevorzugt mit 
homologen Zielregionen und mit einem exprimierbaren Selektions- 
marker (Promotor - 5'UTR - Selektionsmarker - 3'UTR) ausgerustet 
und enthalt in dieser Ausfuhrungsf orm bevorzugt eine RE-Sequenz. 
Das RE-Konstrukt kann - optional - bereits weitere Gene von 

15 Interesse kodieren. Es werden iiberwiegend homoplastome Master - 
pflanzen erzeugt. 

Wie bereits oben beschrieben stellt A/A' bzw. B/B' das Ergebnis 
einer homologen Rekombination dar. Auch wenn diese Sequenzen in 
20 nachfolgenden Schritten noch im Plastom vorhanden sind, sind sie 
in den entsprechenden Abbildungen nicht mehr dargestellt, da sie 
funktionell ohne Relevanz sind. 

2. Fig. 2: Einfuhrung einer Insertionssequenz mit einer 
25 Expressionskassette fur eine Rekombinase und ggf. 

Selektionsmarker sowie weiteren Genen von Interesse 

Explantate der durch Ausfuhrungsf orm 1 hergestellten Master- 
pflanzen werden fur eine weitere Transformation mit einem 
30 erfindungsgemafien zirkularen Transformationskonstrukt genutzt. 
Die Rekombinase wird dabei von dem Transformationskonstrukt 
selber unter Kontrolle eines in Plastiden funktionellen 
Promotors exprimiert. 

35 3. Fig. 3: Einfuhrung einer Insertionssequenz mit ggf. Selek- 
tionsmarker sowie weiteren Genen von Interesse und 
Expression/Einbringung der Rekombinase in trans 

In weiteren bevorzugten Ausfuhrungsform wird die Rekombinase 
40 nicht von dem Transformationskonstrukt kodiert, sondern entweder 
in trans exprimiert (in Plastiden oder als PLS-Fusionsprotein im 
Kern) bzw. in Form von RNA oder als Protein in die Plastiden 
transfiziert. Diese Ausfuhrungsform ist insbesondere dann bevor- 
zugt, wenn das Transformationskonstrukt keine Promotorelemente 
45 umfasst, und eine Expression der kodierten Gene erst nach Inser- 
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tion in das Plastom unter Verwendung plastidarer, endogener 
Promotoren realisiert wird. 

4. Fig. 4: Einfiihrung eines RE-Konstruktes mit zwei RE-Sequenzen 

5 

In einer weiteren Ausfuhrungsform 2 wird zunachst ein RE- 
Konstrukt mit zwei RE-Sequenzen in Plastiden einer hoheren 
Pflanze eingebracht. Das RE-Konstrukt wird in dieser Ausfiihrungs- 
form bevorzugt mit homologen zielregionen und mit einem expri- 
10 mierbaren Selektionsmarker (Promotor - 5'UTR - Selektionsmarker - 
3'UTR) ausgeriistet . Dabei kSnnen die beiden eingebrachten RE- 
Sequenzen gleich oder unterschiedlich sein, kSnnen aber bevorzugt 
nicht - unter Einfluss einer Rekombinase - miteinander rekombi- 
nieren. 

15 

Das RE-Konstrukt kann - optional - bereits weitere Gene von 
Interesse kodieren. Es werden iiberwiegend homoplastome Master- 
pflanzen erzeugt. 

20 5. Fig. 5: Einfiihrung einer Insertionssequenz mit zwei RE- 
Sequenzen und mit ggf . Selektionsmarker sowie 
weiteren Genen von Interesse 

Explantate der unter Ausfuhrungsform 2 (vgl. Fig. 4) hergestell- 
25 ten Masterpf lanzen werden fur eine weitere Transformation mit 
einem erf indungsgemafcen Transf ormationskonstrukt genutzt, das 
wiederum zwei RE-Sequenzen hat. Das Konstrukt kann linear oder 
zirkular sein (Fig. 5) . Dabei kSnnen die beiden RE-Sequenzen 
gleich oder unterschiedlich sein, kSnnen aber bevorzugt nicht 
30 - unter Einfluss einer Rekombinase - miteinander rekombinieren. 

Die Rekombinase bzw. die Rekombinasen konnen dabei von dem Trans - 
formationskonstrukt selber unter Kontrolle eines in Plastiden 
funktionellen Promotors exprimiert oder aber auch in trans expri- 
35 miert werden {in Plastiden oder als PLS-Fusionsprotein im Kern) 
bzw. in Form von RNA oder als Protein in die Plastiden trans- 
fiziert werden. 

6. Fig. 6: Einfiihrung eines RE/DSB-Konstruktes mit einer RE- 
4 0 Sequenz und einer DSB-Erkennungssequenz 

In einer weiteren Ausfuhrungsform 3 wird zunachst ein RE/DSB-Kon- 
strukt mit mindestens einer RE-Sequenz und einer DSB-Erkennungs- 
sequenz in Plastiden einer hfiheren Pflanze eingebracht. Das RE- 
45 Konstrukt wird in dieser Ausfuhrungsform bevorzugt mit homologen 
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Zielregionen und mit einem exprimierbaren Selektionsmarker 
(Promotor - 5'UTR - Selektionsmarker - 3'UTR) ausgeriistet. 

Das RE-Konstrukt kann - optional - bereits weitere Gene von 
5 Interesse - wie beispielsweise einen negativen Selektionsmarker - 
kodieren. Es werden uberwiegend homoplastome Masterpf lanzen 
erzeugt . 

7. Fig.7A-C: Einfilhrung einer Insertionssequenz sowie Expression/ 
X0 Einbringung einer Rekombinase und eines DSBI-Enzyms 

Explantate der gemaS Ausfuhrungsform 3 hergestellten Master- 
pf lanzen (vgl. Fig. 6) werden fur eine weitere Transformation 
mit einem erf indungsgemaSen Trans format ionskonstrukt genutzt, das 
15 wiederum eine RE-Sequenz hat und zusatzlich Sequenzabschnitte 
enthalt, die zu denen im RE/DSB-Konstrukt homolog sind (z.B. 
Sequenz eines Selektionsmarkers oder eines teils derselben) . 
Durch Wirkung einer Rekombinase entsteht ein entsprechendes 
Rekombinationprodukt (Fig. 7A) . 

20 

Die Rekombinase kann dabei von dem Trans formationskonstrukt 
selber unter Kontrolle eines in Plastiden funktionellen 
Promotors exprimiert oder aber auch in trans exprimiert werden 
(in Plastiden oder als PLS-Fusionsprotein im Kern) bzw. in Form 
25 von RNA oder als Protein in die Plastiden transfiziert werden. 

Das Rekombinationsprodukt wird dann der Wirkung eines DSBI-Enzym 
ausgesetzt, dass die durch das RE/DSB-Konstrukt eingefuhrte DSB- 
Erkennungsseguenz erkennt und schneidet. Das DSBI-Enzym kann da- 

30 bei von dem Trans formationskonstrukt selber unter Kontrolle eines 
in Plastiden funktionellen Promotors exprimiert oder aber auch in 
trans exprimiert werden (in Plastiden oder als PLS-Fusionsprotein 
im Kern) bzw. in Form von RNA oder als Protein in die Plastiden 
transfiziert werden. Durch den Schnitt wird eine intramolekulare 

35 homologe Rekombination zwischen homologen Seguenzen erzeugt. 
In dem dargestellten Fall werden diese homologen Seguenzen bei- 
spielsweise durch eine Duplikation eines Selektionsmarkers oder 
Teile desselben dargestellt. Die homologe Rekombination bewirkt 
die Deletion der DSB-Erkennungsseguenz . In einer bevorzugten Aus- 

40 fuhrungsform wird durch die homologe Rekombination zusStzlich ein 
negativer Selektionsmarker deletiert (Fig. 7B) . 

Durch das weiterhin vorliegende DSBI-Enzym kann die so erzeugte 
Plastomart nicht mehr geschnitten werden, wahrend die Kopien 
45 der mit dem RE/DSB-Konstrukt erzeugten Masterpf lanze, die noch 
nicht die Insertionssequenz durch Rekombination insertiert haben, 
nach wie vor geschnitten werden k5nnen. Dadurch baut sich ein 
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Selektionsdruck auf , der - unterstutzt durch eine Reparatur synt- 
hase - zu einer schnellen Anreicherung der erwiinschten plasti- 
daren DNA-Mo 1 ekiil e fuhrt (Fig. 7C) . 

5 Dem Fachmann ist bewusst, dass die Reihenfolge der exprimierten 
Gene in einem Operon austauschbar ist und insofern in den oben 
beschriebenen Ausfuhrungsf ormen variieren kann. Prinzipiell kann 
die Rekombinase und/oder das DSBI-Enzym auf dem Trans format ions - 
konstrukt und/oder separat (im Kern oder Plastiden) exprimiert 
10 oder andersweitig - beispielsweise durch Transfektion mit RNA 
oder Protein in Plastiden - eingebracht werden. 

8. Fig. 8: Deletion von Sequenzen mittels intramolekularer 

homologer Rekombination induziert durch sequenz- 
15 spezifische Doppelstrangbriiche 

Sequenzen - beispielsweise kodierend fur Selektionsmarker bzw. 

DSBI-Enzyme - sind bei alien oben beschriebenen Ausfuhrungs- 

f ormen bevorzugt von Homologiesequenzen Hi und H2 flankiert, die 

20 eine ausreichende Lange und Homologie aufweisen, um miteinander 
zu rekombinieren. Die Rekombination wird durch die Induktion 
mindestens einen Doppelstrangbruches zwischen den beiden Homo- 
logiesequenzen gelegenen DSB-Erkennungssequenz induziert. Zur 
Induktion des Doppelstrangbruches wird bevorzugt ein DSBI-Enzym 

25 transient exprimiert oder eingebracht (Fig. 8) . 

Dem Fachmann ist bewusst, dass die Reihenfolge der exprimierten 
Gene in. einem Operon austauschbar ist und insofern in den 
oben beschriebenen Ausfuhrungsf ormen variieren kann. Auch 

30 kann bei Verwendung nur einer Homologiesequenz zu Insertion 
der Insertionssequenz diese an der 5'- (wie in den Abbildungen 
gezeigt) oder 3'-Seite des Doppelstrangbruches lokalisiert sein. 
Prinzipiell kann das DSBI-Enzym auf dem Transf ormationskonstrukt 
und/oder separat (im Kern oder Plastiden) exprimiert oder anders- 

35 weitig - beispielsweise durch Transfektion mit RNA oder Protein 
in Plastiden - eingebracht werden. 

9. Fig. 9: Southern Analyse von uberwiegend homotransplastomen 

Pflanzen 

40 

Wildtyp und uberwiegend homotransplastome Masterpf lanzen warden 
beziiglich der Modifikation (Einfuhrung einer RE-Sequenz) analy- 
siert (vgl. Beispiel 4). Durch die Modifikation wurde eine Bande 
von 1750 bp detektiert (Bahn 2, 3, und 4 entsprechend den Linien 
45 CB199NTH-4, -6, und -8), wahrend in der nicht modif izierten Wild- 
typpflanze eine Bande von 3100 bp detektiert wurde (Bahn 1) . 
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Fig. 10: Southern Analyse von iiberwiegend homotransplastomen 
Pf lanzen 

A: Wildtyp und iiberwiegend homotransplastome Masterpf lanzen 

5 wurden beziiglich der Modifikation (Einfuhrung einer RE- und 

DSB-Erkennungssequenz ) in einem Southern-Blot analysiert 
(vgl. Beispiel 4). Durch die Modifikation wurde in der hier 
mit Hindlll behandelten DNA eine Bande von etwa 3,8 kb detek- 
tiert (Bahn 2, 3 und 4 entsprechend den Linien CB199NTH-4, 

.0 -6, und -8), wahrend in der nicht modif izierten Wildtyp- 

pflanze eine Bande von etwa 7,7 kb detektiert wurde (Bahn 5) . 
In den Linien CB199NTH-4, -6, und -8 ist neben der erwarteten 
etwa 3,8 kb Bande und der etwa 7,7 kb Bande noch eine Bande 
bei etwa 5,2 kb zu erkennen. Diese Bande ergibt sich (wie in 

.5 B verdeutlicht) aus der Hybridisierung des 16SrRNA-Promotors, 

welcher in der Sonde enthalten ist, mit dem 16SrRNA Promotor, 
der stromabwarts des Selektionsmarker aadA zu finden ist. 
Diese etwa 5,2 kb grofie Bande ist wesentlich schwacher als 
die 3,8 kb grofie Bande weil nur ein kleiner Anteil der Sonde 

:0 tatsachlich mit diesem Fragment hybridisiert (wt, nicht modi- 

fizierte Wildtyppf lanze; m - Molekularer GrSEenstandard) 

B: Schematische Darstellung der Hindlll Fragmente, welche in A 
durch die Hybridisierung mit der Sonde (probe) in einer nicht 

:5 modifizierte Wildtyppf lanze (oben) und einer modif izierten 

Pf lanze CB199NTH (unten) zu erwarten waren. (tmV - Gen 
codierend fur eine tRNA-Val; rrnl6 - Gen kodierend fur die 
16SrRWA; aadA - Gen codierend fur einen Selektionsmarker ,- 
3*psbA - nicht kodierender Bereich stromabwarts des psbA 

,0 Gens, hier eingebaut in die Expressionskassette fur den 

Selektionsmarker aadA) 



Fig. 11: Southern Analyse von iiberwiegend homotransplastomen 

Pflanzen 

35 

A: Wildtyp und iiberwiegend homotransplastome Masterpf lanzen 

wurden beziiglich der Modifikation (Einfuhrung einer RE- und 
DSB-Erkennungssequenz) in einem Southern analysiert (vgl. 
Beispiel 14) . Durch die Modifikation wurde in der hier mit 

40 EcoRI behandelten DNA eine Bande von etwa 1,7 kb detektiert 
(Bahn 1 und 4 entsprechend den Linien CB456NTH-1 und -15) , 
wahrend in der nicht modifizierten Wildtyppf lanze eine Bande 
von etwa 3,1 kb detektiert wurde (Bahn 6). (wt - nicht modi- 
fizierte Wildtyppf lanze; wildtype - zeigt die erwartete Frag- 

45 mentgrofie in nicht modifizierten Wildtyppf lanzen an; trans- 
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genie - zeigt die erwartete Fragmentgr5fie in Pflanzen 
CB456NTH an) 

B: Schematische Darstellung des EcoRI Fragments, welches in A 
5 durch die Hybridisierung mit der Sonde (probe) in einer modi- 

fizierten Pflanze CB456NTH zu erwarten war. (trnV - Gen 
codierend fur eine tRNA-Val; rrnl6 - Gen codierend fur die 
16SrRNA; aadA - Gen codierend fur einen Selektionsmarker ; 
3'psbA (Synec) - nicht kodierender Bereich stromabwarts 
10 des psbA-1 Gens aus Synechocystis, hier eingebaut in die 

Expressionskassette fur den Selektionsmarker aadA; Psynth. - 
synthetischer Promotor abgeleitet von der Konsensusseguenz 
fiir E. coli C70 Promotoren) . 

15 Beispiele 

Allgemeine Methoden: 

Die chemische Synthese von Oligonukleotiden kann beispielsweise, 
20 in bekannter Weise, nach der Phosphoamiditmethode (Voet, Voet, 
2. Auflage, Wiley Press New York, Seite 896-897) erfolgen. Die 
im Rahmen der vorliegenden Erf indung durchgefuhrten Klonierungs- 
schritte wie z.B. Restriktionsspaltungen, Agorosegelelektro- 
phorese, Reinigung von DNA-Fragmenten, Transfer von Nuklein- 
25 sauren auf Nitrozellulose und Nylonmembranen, Verknupfen von 
DNA-Fragmenten, Transformation von E. coli Zellen, Anzucht von 
Bakterien, Vermehrung von Phagen und Seguenz analyse rekombinanter 
DNA werden wie bei Sambrook et al. (1989) Cold Spring Harbor 
Laboratory Press; ISBN 0-87969-309-6 beschrieben durchgef iihrt . 
30 Die Sequenzierung rekombinanter DNA-Molekule erfolgt mit einem 
Laserfluoreszenz-DNA-Seguenzierer ALF-Express (Pharmacia, Upsala, 
Schweden) nach der Methode von Sanger (Sanger et al. (1977) Proc 
Natl Acad Sci USA 74:5463-5467). 

35 Beispiel 1: Erstellen eines Basis Vektors fur die Plastidentrans- 
formation 

Zunachst wurden aus dem Plastom der Tabak Varietat SRI die aus- 
gewahlte Zielregionen mittels PCR kloniert. Die linke Zielregion 
40 wurde dabei mit den Primern pl9 und p20 amplif iziert . 

pi 9: 5 ' -TAAGGCCCTCGGTAGCAACGG-3 ' (SEQ ID NO: 6) 



p20: 5 ' -GGGGTACCAAATCCAACTAG-3 ' (SEQ ID NO: 7) 

45 
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Zur Amplifikation der rechten Zielregion wurden die Primer p21 
und p22 verwendet, wobei durch letzteren Primer in den amplifi- 
zierten Teil der ISSrDNA zusatzlich zur SRI Resistenz (binding 
type marker) auch noch eine Spectinomycin-Resistenz eingebracht 
5 wurde. 

p21: 5 ' -GGAGCTCGCTCCCCCGCCGTCGTTC-3 ' (SEQ ID NO: 8) 
p22: 5 ' -GATGCATGATGACTTGACGGCATCCTC-3 ' (SEQ ID NO: 9) 

10 

Die beiden amplif izierten Regionen wurden in pBluescript bzw. 
pZeroBlunt kloniert und seguenziert. Die linke und rechte Ziel- 
regionen wurden anschliefiend in das Riickgrat des pUC19 Vektors 
kloniert. Dazu wurden die Schnittstellen Eco0109l und PvuII des 

15 Vektors genutzt. Zwischen die linke und rechte Zielregion wurde 
eine multiple Klonierungsstelle aus dem pBluescript (von Kpnl 
bis SacI) kloniert. Diese befindet sich im Basisvektor fur die 
Plastidentrans formation zwischen den beiden plastidar kodierten 
Genen trnV und rrnl6. Dieser Basisvektor far die Plastidentrans- 

20 formation erhielt die Bezeichnung pCB42-94 (SEQ ID NO: 1). Der 
Vektor enthalt nachfolgende Sequenzelemente : 

a) Position komplementar bp 55-1405: Rechte Zielregion mit dem 
partiellen Gen der 16SrRNA (komplementar bp 56 bis 1322). 

25 In letzterem sind Mutationen fur die Streptomycin-Resistenz 

(SRI, Position bp 346) und Spectinomycin-Resistenz (SPC1, 
Position bp 68) . 

b) Position komplementar bp 2374 bis 1510: Linke Zielregion 
30 umfassend u.a. ORF131 (bp 1729 bis 2124) und trnV Gen 

(komplementar bp 1613 bis 1542). 

c) Position bp 1404 bis 1511: multiple Klonierungsstelle 

35 d) Position bp 2629 bis 3417: Ampicilin Resistenz im Vektor- 
rttckgrat 

Beispiel 2: Erstellen eines Vektors (pCBl99-3) fur die Ein- 

bringung einer nicht nattirlicherweise vorkommenden 
40 DSB-Erkennungssequenz fur die Homing Endonukleasen 

I-Ppol und RE-Seguenzen (attB) fur die Rekombi- 
nasen <t>C31 und TP901-1 in das Plastom von Tabak 

In die multiple Klonierungsstelle des Basisvektors pCB42-94 
45 (SEQ ID NO: 1) fur die Plastidentransformation wurden sukzessive 
verschiedene Elemente kloniert: 
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a) frt Erkennungsregion (mutiert, enthalt keine Xbal Schnitt- 
stelle; komplementar 1307-1354) 

b) Expressionskassette zur Expression des Markergens aadA 
5 bestehend aus : 

i) Promotor des Gens fur 16SrRKTA (komplementar 1191-1281) 

ii) 5' untranslatierte Bereich des Tabak rbcL Gens (komple- 
!0 " mentar 1167-1184) einschlieSlich mutierter 5' Anteilen 

des rbcL Gens (Duplikation von 6 AS des rbcL Gens, teil- 
weise mutiert, als Folge der Klonierungsstrategie , so 
dass eine Fusion codierend fur insgesamt 12 Aminosauren 
(komplementar 1131-1166) mit dem nachf olgendem Element, 
15 dem aadA Gen, entstand) 

iii) aadA Gen (komplementar 336-1130) 

iv) der 3' Bereich des psbA Gens (komplimentar 232-323) 

20 

c) attB RE-Sequenzen fur die Rekombinasen *C31 (Position Basen- 
paar 131 bis 170) und TP901-1 (Position Basenpaar 21 bis 121) 

d) Core-Erkennungsregion fur die Homing Endonuklease I-Ppol 
25 (Position Basenpaar komplementar 176 bis 190). 

Anstelle der multiplen Klonierungsstelle im Basisvektor fur die 
Plastidentransformation enthalt dieser Vektor mit der Bezeichnung 
pCB199-3 die aufgefuhrten Elemente im Rahmen der Nukleinsaure- 
30 sequenz mit der SEQ ID NO: 2. Angegeben ist die Sequenz, die 
die komplette MCS von Kpnl bis SacI ersetzt. In der angegebenen 
Sequenz gibt es aufgrund der Klonierungsstrategie jedoch keine 
Kpnl Schnittstelle mehr. 

35 Beispiel 3: Erstellen eines weiteren Vektors (pCB401-20) fur die 
Einbringung einer nicht natiirlicherweise vorkommende 
Erkennungsregion fur die Homing Endonukleasen I-Ppol 
und RE-Sequenzen (attB) fur die Rekombinasen <E>C31 
und TP901-1 in das Plastom von Tabak 

40 

Im Gegensatz zu dem in Beispiel 2 beschriebenen Vektor pCB199-3 
enthalt der hier beschriebene Vektor keinen Promotor und 3'UTR, 
der direkt mit dem Selektionsmarker aadA verknupft wurde. Viel- 
mehr wird die Expression des aadA Gens ausgehend von dem Promotor 
45 des trnV Gens, welches im Plastidengenom bzw. in der linken Ziel- 
region stromaufwarts des aadA Gens lokalisiert ist, gesteuert. 
Ziel bei der Erstellung dieses Vektors war es, Sequenzdupli- 
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kationen durch das Ausnutzen von regulatorischen Bereichen aus 
dem Tabakplastidengenom zu vermeiden. Dazu wurden in die multiple 
Klonierungsstelle des Basisvektors pCB42-94 fur die Plastiden- 
trans formation sukzessive verschiedene Elemente kloniert: 

5 

a) Ribosomenbindestelle (komplementar bp 1033 bis 1050) 

b) aadA Gen (komplementar bp 238 bis 1032) 

10 c) attB RE-Sequenzen fur die Rekombinasen 4>C31 (Position Basen- 
paar 131 bis 170) und TP901-1 (Position Basenpaar 21 bis 121) 

d) Core-Erkennungsregion fur die Homing Endonukleasen I-Ppol 
(komplementar bp 176 bis 190) 

15 

Der so erhaltene Vektor vermittelt auch in E. coli eine Spectino- 
mycin Resistenz. Anstelle der multiplen Klonierungsstelle im 
Basisvektor pCB42-94 (SEQ ID NO: 1) fur die Plastidentrans- 
formation enthalt dieser Vektor mit der Bezeichnung pCB401-20 
20 die aufgefuhrten Elemente im Rahmen der Nukleinsauresequenz mit 
der SEQ ID NO: 3. Auch hier ist die gesamte die MCS ersetzende 
Sequenz (von Sad bis Kpnl) angegeben. 

Beispiel 4: Erstellen von iiberwiegend homoplastomischen Tabak 
25 Masterpflanzen, die eine nicht naturliche DSB- 

Erkennungs sequenz und RE-Sequenzen (attB) enthalten 

Das Plasmid pCBl99-3 wurde in die Plastiden von Tabak {Nicotiana 
tabacum cv. Petit Havana) wie im folgenden beschrieben einge- 
30 bracht. Die regenerierten Pflanzen wurden CB199NTH genannt. Unab- 
hangige Linien wurden mit verschiedenen Endnummern (zum Beispiel 
CB199NTH-4) versehen. 

Analog wird der Vektor pCB401-20 in die Plastiden von Tabak ein- 
35 gebracht. Die resultierenden Pflanzen werden entsprechend mit 
CB401NTH bezeichnet. 

Zunachst wurden von in vitro gewachsenen Pflanzen mit einem 
sterilen Korkbohrer Blattscheibchen mit einem Durchraesser von 

40 2,0 bis 2,5 cm ausgestochen und je mit der Blattoberseite auf 
eine Petrischale mit Beschussmedium (MS-Salze (Sigma-Aldrich) : 
4,3 g/L; Saccharose: 30,0 g/L, Phytoagar (Duchefa, P1003): 0,6 % 
(w/v) ; pH 5,8. Nach dem Autoklavieren wurden 1,0 mg/L Thiamin 
(Duchefa, T0614) und 0,1 g/L myo-Innositol (Duchefa, 10609) zuge- 

45 geben) . Die vom Agar abgewandte Blattunterseite wurde mittels der 
Partikelkanone anschlieSend beschossen. Dazu wurde zunachst die 
zu transformierende Plasmid-DNA (aus E. coli gereinigt mittels 
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Nucleobond AX100 Macherey & Nagel) nach folgendem Protokoll 
auf 0,6 |im groSe Goldpartikel aufgebracht {"Coating"). Zunachst 
wurden 30 mg Goldpulver (BioRad) in Ethanol auf genommen. 60 Ul 
von der Goldsuspension werden in ein neues EppendorfgefaS tiber- 
5 fiihrt und die Goldpartikel durch Zentrifugation (fur 10 Sekunden) 
sedimentiert. Die Goldpartikel wurden zweimal in je 200 ul 
sterilem Wasser gewaschen und nach einera weiteren Zentri- 
fugationsschritt in 55 Ul Wasser auf genommen . Unter standigem 
Mischen (Vortexen) wurden schnell hinzugegeben : 

10 

5 ul Plasmid-DNA (1 Ug/Ul) 

50 Ul 2,5 M CaCl 2 

20 Jll 0,1 M Spermidine 

15 Die Suspension wurde sodann fur weitere 3 Minuten auf dem Vortex 
gemischt und anschlieSend kurz anzentrifugiert . Die sedimentier- 
ten Gold-DNA-Komplexe wurden 1 bis 2 mal in je 200 Ul Ethanol 
gewaschen und nach einem weiteren Zentrifugationsschritt schlieS- 
lich in 63 ul Ethanol auf genommen . Pro Schuss wurden 3,5 Ul (ent- 

20 sprechend 100 ug Gold) dieser Suspension auf einen Macrocarrier 
aufgebracht . 

GemaS den Herstellerangaben wurde die Partikelkanone (BioRad, 
PDSlOOOHe) vorbereitet und die Blattexplantate in einem Abstand 

25 von 10 cm mit den Gold-DNA-Komplexen beschossen. Dabei wurden 

folgende Parameter verwendet: Vakuum: 27 inch Hg, Druck 1100 psi. 
Die Explantate werden nach dem Beschuss fiir 2 Tage in Klimakam- 
mern (24°C, 16 h Licht, 8 h Dunkelheit) inkubiert und anschlieSend 
mit einem Skalpell in etwa 0,5 cmZ groSe Segmente zerteilt. Diese 

30 Segmente wurden dann auf Regenerationsmedium [Beschussmedium zu- 
zuglich 1 mg/L 6-Benzylaminopurin (BAP, Duchefa, B0904) und 0,1 
mg/L Naphthylessigsaure (NAA, Duchefa, N0903)] zuzuglich 500 mg/L 
Spectinomycin (Duchefa, S0188) uberfuhrt und fiir 10 bis 14 Tage 
unter oben genannten Bedingungen in einer Klimakammer inkubiert. 

35 Nach Ablauf dieser Zeit wurden die Blattsegmente auf frisches 
Regenerationsmedium zuzuglich 500 mg/L Spectinomycin uberfuhrt. 
Dieser Vorgang wurde so lange wiederholt, bis sich griine Sprosse 
an den Explantaten bildeten. Die Sprosse wurden mit einem' Skalpel 
abgetrennt und auf Anzuchtmedium (wie Beschussmedium, jedoch 

40 10 g/L Saccharose anstelle von 30 g/L Saccharose) zuzuglich 
500 mg/L Spectinomycin angezogen. 

Optional konnen, urn moglichst tiberwiegend homoplastome Pflanzen 
zu erhalten, von den regenerierten Pflanzen wiederum Explantate 
45 abgeschnitten und auf Regenerationsmedium mit 1000 mg/L Spectino- 
mycin gelegt werden. Regenerierende Sprosse werden in Glaser mit 
Anzuchtmedium zuzuglich 500 bis 1000 mg/L Spectinomycin gesetzt. 



WO 03/054201 PC17EP02/14303 
93 

Nach dem Bewurzeln werden die Pflanzen ins Gewachshaus trans- 
feriert und dort auf Erde bis zur Samenreife herangezogen. 

Im Fall der Transformation nit dem Plasmid pCB199-3 wurden 
5 8 Pflanzen erhalten, die Resistenz gegeniiber Spectinomycin 
zeigten. Mittels PCR und Southern-Analysen wurde nachgewiesen, 
dass drei dieser Linien (Linien CB199NTH-4, -6 und -8) auch 
tatsachlich das aadA Gen in das Plastidengenom eingebaut haben. 

10 Zur Analyse der transplastomen Pflanzen nach Southern wurde 
Gesamt-DNA aus Blattern von trans formierten und nicht trans- 
formierten Pflanzen wurde mit Hilfe des GenElute Plant Genomic 
DNA Kit (Sigma) isoliert. Die DNA wurde dabei in 200 Hi Eluat 
aufgenommen. 86 |xl davon wurden je mit 10 ul lOx Restriktions- 

15 puffer sowie 40 U Restriktionsendonuklease versetzt und 4 bis 8 h 
bei der fur das Restriktionsenzym empfohlenen Temperatur inku- 
biert. AnschlieSend wurde die DNA in dem Fachmann bekannter Weise 
mit Ethanol prazipitiert und anschlieSend in 20 (Xl Wasser auf- 
genommen. Die Proben wurden anschlieSend gemaS dem Fachmann 

20 bekannten Verfahren auf einem Agarosegel aufgetrennt, die DNA 
in dem Gel denaturiert und mittels Kapillarblot auf Nylonmembran 
ubertragen. 

Eine entsprechende Sonde fur die radioaktive Hybridisierung wurde 
25 mit Hilfe des HighPrime (Roche) Systems erstellt. Die Membran 
wurde zunachst 1 h bei 65°C mit HybPuffer (l%(w/v) Rinderseum- 
albumin; 7%(w/v) SDS; 1 mM EDTA; 0,5 M Natriumphosphat-Puf f er, 
pH 7,2) vorhybridisiert. AnschlieSend wurde die hitze-dena- 
turierte Sonde hinzugegeben , und es wurde ttber Nacht bei 65°C 
30 hybridisiert . Die Blots wurden anschlieSend wie folgt gewaschen: 
einmal Spiilen mit 2xSSPE/0 , 1%SDS; fur 15 min. bei 65°C waschen mit 
2xSSPE/0,l%SDS; fur 15 min. bei 65°C waschen mit lxSSPE/0, 1%SDS 
und ggf . wurde der letzte Schritt noch einmal wiederholt (20x 
SSPE ist 3 M NaCl; 0,2 M NaH 2 P0 4 ; 0,5 M EDTA; pH 7,4) . 

35 

Die Hybridisierung wurde anschlieSend mit Hilfe eines Phospho- 
imagers (Molecular Imager FX, BioRad) analysiert. 

Beispielsweise wurde mit PstI geschnittene Gesamt-DNA ver- 
40 schiedener Pflanzen, die nach der Transformation mit pCB199-3 
regeneriert wurden, mit dem aadA Gen als radioaktiv markierte 
Sonde (793bp PstI\NcoI Fragment aus pCBl99-3) hybridisiert. Dabei 
konnte festgestellt werden, dass die Linien CB199NTH-4, -6 und 
-8 tatsachlich das aadA Gen in die DNA eingebaut hatten. Des 
45 weiteren wurde mit EcoRI und Xhol geschnittene gesamt DNA von 

CB199NTH-4, -6 und -8 mit einer radioaktiv markierten Sonde (1082 
bp Bspl20l/Sacl Fragment aus pCB199-3) hybridisiert, welche mit 
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einem Teil der 16S rDNA hybridisiert . Wahrend im Wildtyp (nicht 
trans formierte Pflanze) erwartungsgemaS eine Bande von etwa 3100 
bp nachgewiesen wurde, wurde in den transplastomen Linien tiber- 
wiegend eine Bande bei 1750 bp detektiert, die sich aufgrund 
S der Insertion der Insertionssequenz aus pCB199-3 in das Plastom 
ergibt (Fig. 9). Die erhaltenen Pflanzen konnen als iiberwiegend 
homotransplastom verstanden werden. 

Beispiel 5: Klonierung von Rekombinasen und des DSBI-Enzyms 
10 I-Ppo I 

5.1 Klonieren der Rekombinase aus dem Phagen 3>C31 und nukleare 

Transformation als PLS-Fusion 
Die Rekombinase aus dem Phagen *C31 (DSM No. 49156, DSMZ-Deutsche 
15 Sammlung von Mikroorganismen und Zellkulturen GmbH, Braunschweig, 
Deutschland) wurde mittels PCR amplif iziert . Dazu wurden die 
folgenden Oligonukleotide benutzt: 

p65: ATGGATCCATATGGCCATGGCACAAGGGGTTGTG (SEQ ID NO: 38) 

20 

p66: CCCGGGCTCGAGCTGCAGCTACGCCGCTACGTC (SEQ ID NO: 39) 

Das erhaltene PCR Fragment wurde in pGEM-Teasy kloniert und 
sequenziert. Der resultierende Vektor wurde pCBl09-28 benannt. 

25 AnschlieSend wurde das fur die Rekombinase kodierende Gen an 
Sequenzen fusioniert, die fur das IPP-Transitpeptid codieren, 
und funktionell an den 35S Promotor und vor den ocs Terminator 
gekoppelt. Als Selektionsmarker war neben dem beschriebenen 
Element ein nos-Promotor - pat - nos-Terminator Element vor- 

30 handen, welches die Selektion transgener Pflanzen auf Phosphino- 
tricin erlaubte. Das fertige Binarkonstrukt wurde pCB193-17 
genannt. Die Sequenz des Inserts ist unter SEQ ID NO: 40 
beschrieben und enthalt die nachf olgenden Elemente: 

35 Position Basenpaar 7 bis 535: 35S Promotor 

Position Basenpaar 563 bis 733: Sequenz kodierend fur 
IPP-Transitpeptid 

40 Position Basenpaar 749 bis 2590: Gen kodierend fur die <I>C31 
Rekombinase 

Position Basenpaar 2615 bis 2807: ocs Terminator 

45 Das Plasmid pCB193-17 wurde mittels Agrobakterium-vermittelter 
Transformation in Tabak (N. tabcum cv. Petit Havanna) nach dem 
Fachmann gelaufige Verfahren transf ormiert - Transgene Pflanzen 
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aus dieser Transformation wurden mit CB193NTH bezeichnet. Die 
Expression der <&C31 Rekombinase wurde mittels RealTime PCR nach- 
gewiesen. 

5 5.2 Klonieren der Rekombinase aus dem Phagen TP901-1 und nukleare 
Transformation als PLS-Fusion 

Die Rekombinase aus dem Phagen TP901-1 (lag als Prophage in 
einem lysogenen Stamm von Lactococcus lactis (Stamm 901-1) vor) 
10 wurde mittels PCR amplif iziert . Dazu wurden die folgenden Oligo- 
nukleotide benutzt: 

p71: TGGATCCATATGGCCATGGCTAAGAAAGTAG (SEQ ID NO: 43) 

15 p72: CCTCGAGCTGCAGTTAAGCGAGTTGG (SEQ ID NO: 44) 

Das erhaltene PCR Fragment von 1486 bp wurde in pCR2.1-T0P0 
(Invitrogen) kloniert und sequenziert. Der resultierende Vektor 
wurde pCBl27-2 genannt (zwei Unterschiede wurden in der Sequenz 

20 im Vergleich zur verof f entlichten Sequenz gefunden. Einer davon 
fiihrt zu einem Aminosaureaustausch (V7A) ) . Anschliefiend wurde das 
fur die Rekombinase kodierende Gen an Sequenzen fusioniert, die 
fur das IPP-Transitpeptid codieren, und funktionell an den 35S 
Promotor und vor den ocs Terminator gekoppelt. Als Selektions- 

25 marker war neben dem beschriebenen Element ein nos-Promotor - pat 
- nos-Terminator Element vorhanden, welches die Selektion trans- 
gener Pflanzen auf Phosphinotricin erlaubte. Das fertige Binar- 
konstrukt wurde pCB245-37 genannt. Die Sequenz des Inserts ist 
unter SEQ ID NO: 45 beschrieben und enthalt die nachfolgenden 

30 Elemenete: 

Position Basenpaar 12 bis 540: 35S Promotor 

Position Basenpaar 568 bis 738: Sequenz kodierend fur 
35 IPP-Transitpeptid 

Position Basenpaar 748 bis 2205: Gen kodierend fur die TP901-1 
Rekombinase 



40 Position Basenpaar 2231 bis 2422: ocs Terminator 

Das Plasmid pCB245-37 wurde mittels Agrobakterium-vermittelter 
Transformation in Tabak (N. tabcum cv. Petit Havanna) nach dem 
Fachmann gelaufige Verfahren transf ormiert . Transgene Pflanzen 
45 aus dieser Transformation wurden mit CB245NTH bezeichnet. Die 
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Expression der TP901-1 Rekombinase wurde mittels RealTime PCR 
nachgewiesen . 

5.3 Klonieren der Homing Endonuklease I-Ppol 

5 

Die Homing Endonuklease I-Ppol wurde aus 26 synthetisch 
erstellten Oliogonukleotiden mittels PCR in Anlehnung an die 
Methode von Stemmer WPC et al. (1995) Gene 164: 49-53 erstellt 
(SEQ ID NO: 4) . Die zugrunde liegende Sequenz wurde von der 
10 veroffentlichten Sequenz abgeleitet (Accession No. M38131 Nucleo- 
tide 86 bis 577). Dabei wurden einige Mutationen eingefuhrt, urn 
Erkennungsstellen fur Restriktionsendonukleasen aus dem Gen zu 
entfernen, von denen aber keine eine veranderte Aminosauresequenz 
bedingt . 

15 

Beispiel 6: Kreuzen von Masterpf lanzen CB199NTH mit Rekombinase 
exprimierenden Pflanzen 

6.1 Kreuzen von Masterpf lanzen CB199NTH mit <E>C31 Rekombinase 
20 exprimierenden Pflanzen CB193NTH 

Pollen der Pflanzen CB193NTH wurden auf die Narbe von Bluten der 
Pflanzen CB199NTH (Linien -4, -6 und -8) gestaubt. Zuvor wurden 
die Antheren der entsprechenden Bluten von den CB199NTH Pflanzen 

25 entfernt. Die Pflanzen wurden bis zur Samenreife weiter im 

Gewachshaus belassen. Die geernteten Samen wurden in vitro auf 
Anzuchtmedium (vgl. Beispiel 4; zuzgl. 500 mg/L Spectinomycin, 
10 mg/L. Phosphinotricin) ausgelegt und resistente Pflanzen unter 
sterilen Bedingungen weiter angezogen. Diese Pflanzen wurden mit 

30 CB199NTHxCBl93NTH bezeichnet. Explantate von 4 bis 8 Wochen alten 
Pflanzen wurden fur weitere Beschussexperimente (s.u.) genutzt. 

6.2 Kreuzen von Masterpf lanzen CB199NTH mit TP901-1 Rekombinase 
exprimierenden Pflanzen CB245NTH 

35 

Pollen der Pflanzen CB245NTH wurden auf die Narbe von Bluten der 
Pflanzen CB199NTH (Linien -4, -6 und -8) gestaubt. Zuvor wurden 
die Antheren der entsprechenden Bluten von den CB199NTH Pflanzen 
entfernt. Die Pflanzen wurden bis zur Samenreife weiter im 

40 Gewachshaus belassen. Die geernteten Samen wurden in vitro auf 
Anzuchtmedium (vgl. Beispiel 4; zuzgl. 500 mg/L Spectinomycin, 
10 mg/L Phosphinotricin) ausgelegt und resistente Pflanzen unter 
sterilen Bedingungen weiter angezogen. Diese Pflanzen wurden mit 
CBl99NTHxCB245NTH bezeichnet. Explantate von 4 bis 8 Wochen alten 

45 Pflanzen wurden fur weitere Beschussexperimente (s.u.) genutzt. 
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Beispiel 7: Erstellen eines Vektors, der fur die Integration 

mit Hilfe von Rekombinasen in das Plastom von ent- 
sprechenden Masterpf lanzen geeignet ist 

5 Sukzessive wurden die verschiedenen Elemente, die fur so einen 
Vektor notwendig sind in das Rtickgrat des pBLUESCRIPT kloniert. 
Die angegebene Sequenz ersetzt die multiple Klonierungsstelle 
des pBLUESCRIPT von Kpnl bis SacI, wobei die Kpnl Schnittstelle 
in der angegebenen Sequenz aufgrund der Klonierungsstrategie 
10 nicht mehr funktionell vorhanden ist. Das Ruckgrat des Vektors 
entspricht dem des pBLUESCRIPT. Der erhaltene Vektor wurde 
rait pCB249-24 bezeichnet. Das Insert ist durch SEQ ID NO: 48 
beschrieben und umfasst nachfolgende Elemente: 



15 Elemente: 

Position Basenpaar 861 bis 910: < 
1 

20 Position Basenpaar 925 bis 1031: 1 
Position Basenpaar 1040 bis 1060: 

25 Position Basenpaar 1076 bis 1879: 
Position Basenpaar 1916 bis 2053: 



attP Erkennungsregion fur die 
Rekombinase aus OC31 

Prpsl6 Promotor aus Tabak 

: 5'rbcL (5' untranslatierter 
Bereich vom rbcL Gen aus Tabak) 

: nptll Gen 

: 3'rbcL (3' untranslatierter 
Bereich vom rbcL Gen aus Tabak) 



30 Beispiel 9: Erstellen eines Vektors, der fur die Integration 

mit Hilfe von Rekombinasen in das Plastom von ent- 
sprechenden Masterpf lanzen geeignet ist und einen 
Schnitt durch ein DSBI-Enzym ermoglicht 

35 Sukzessive wurden die verschiedenen Elemente, die fur einen sol- 
chen Vektor notwendig sind in das Ruckgrat des pBLUESCRIPT klo- 
niert. Die angegebene Sequenz ersetzt die multiple Klonierungs- 
stelle des pBLUESCRIPT von Kpnl bis SacI, wobei die Kpnl Schnitt- 
stelle in der angegebenen Sequenz aufgrund der Klonierungsstelle 

40 nicht mehr funktionell vorhanden ist. Das Ruckgrat des Vektors 
entspricht dem des pBLUESCRIPT. Der erhaltene Vektor wurde 
mit pCB384-40 bezeichnet. Das Insert ist durch SEQ ID NO: 49 
beschrieben und umfasst nachfolgende Elemente: 
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i) Position Basenpaar 70 bis 765: homologe Region zu Plastom- 
sequenzen in den Masterpflanzen CB199NTH - nach der Inte- 
gration der hier betrachteten Insertionssequenz mittels 
PhiC31 Rekombinase liegt dieser Bereich dupliziert als 

5 direkter "repeat" (gleiche Orientierung) zu den homologen 

Sequenzen aus CB199NTH vor. Dies erlaubt die intrachro- 
mosomale Rekombination nach der Insertion der Insertions- 
sequenz, was zur Eliminierung der I-Ppol Erkennungsregion 
aus den bereits durch Insertion raodif izierten Plastomkopien 
10 fuhrt. Darin enthalten komplimentSr von Basenpaar 70 bis 

163 eine 3'psbA Sequenz und komplimentar von Basenpaar 175 
bis 765 ein Anteil vom aadA Gen. 

ii) Position Basenpaar 861 bis 910: attP Erkennungsregion fur 
15 die Rekombinase aus PhiC31 

iii) Position Basenpaar 925 bis 1031: Prpsl6 Promotor aus Tabak 

iv) Position Basenpaar 1040 bis 1060: 5'rbcL (5' untranslatier- 
20 ter Bereich vom rbcL Gen aus Tabak) 

v) Position Basenpaar 1076 bis 1879: nptll Gen 

vi) osition Basenpaar 1897 bis 1974: 5'psbA (5' untranslatier- 
25 ter Bereich des pshA Gens aus Tabak) 

vii) Position Basenpaar 1975 bis 2466: codierende Region fur die 
Homing Endonuklease I-Ppol 

30 viii) Position Basenpaar 2501 bis 2638: 3'rbcL (3' untranslatier- 
ter Bereich des rbcL Gens aus Tabak) 

Beispiel 10: Transformation von CB199NTHxCB193NTH Pflanzen mit 
PCB249-24 

35 

Zunachst wurde die Insertionssequenz in vitro aus dem Plasmid 
ausgeschnitten und diese anschlieSend zirkularisiert . 5 fig der 
DNA von pCB249-24 wurden dazu mit 10 U Sail (Roche) und 10U Xhol 
(Roche) in einem 20ul Restriktionsansatz unter den vom Hersteller 

40 angegebenen Bedingungen fur 2h inkubiert. AnschlieSend wurde der 
Ansatz 20 Minuten bei 65°C inkubiert. Uber Nacht wurde bei 14°C 
eine Ligationsreaktion durchgefuhrt (Zugabe von 5 u,l IOx Ligase- 
puffer, 2U T4-Ligase (Roche) zum Restriktionsansatz und auffiillen 
auf 50H1 mit Wasser) . Unter den gewahlten Bedingungen wurde uber- 

45 wiegend eine Rezirkularisierung der Fragmente beobachtet (nicht 
gezeigt) . Die DNA wurde aus dem Ligationsansatz mit Hilfe des 
Wizard Plus Minipreps DNA Purification System (Promega) auf- 
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gereinigt. Dabei wurde anstelle von Bakterien der Ligationsansatz 
eingesetzt. Die Elution der DNA erfolgte abweichend vom Her- 
stellerprotokoll in 30 Ul (anstelle von 50 jjl) Wasser. Die so auf- 
gereinigte DNA wurde in einen Coating-Ansatz wie unter Beispiel 4 
5 beschrieben eingesetzt (es wurden dann entsprechend weniger als 
die oben angegebenen 55 \il Wasser eingesetzt) . 

Die DNA wurde sodann wie unter Beispiel 4 beschrieben auf Tabak 
(Nicotiana tabacum cv. Petit Havanna CB199NTH X CB193NTH) Blatter 
10 geschossen. Abweichend zu den Angaben in Beispiel 4 erfolgt die 
Selektion auf 30, 50 oder 100 mg/L Kanamycin. 

Beispiel 12: Transformation von CBl99NTHxCB193NTH Pflanzen mit 
PCB384-40 

15 

Zunachst wurde die Insert ionssequenz in vitro aus dem Plasmid 
ausgeschnitten und diese anschliefcend zirkularisiert. 5 fig der 
DNA von pCB3 84-40 wurden dazu mit 10 U Sail (Roche) und 10U Xhol 
(Roche) in einem 20*1.1 Restriktionsansatz unter den vom Hersteller 

20 angegebenen Bedingungen fur 2h inkubiert. AnschlieSend wurde der 
Ansatz 20 Minuten bei 65°C inkubiert. fiber Nacht wurde bei 14°C 
eine Ligat ions reakt ion durchgefuhrt (Zugabe von 5JJ.1 lOx Ligase- 
puffer, 2U T4-Ligase (Roche) zum Restriktionsansatz und auffiillen 
auf 50 {il mit Wasser) . Unter den gewahlten Bedingungen wurde 

25 uberwiegend eine Rezirkularisierung der Fragmente beobachtet 

(nicht gezeigt) . Die DNA wurde aus dem Ligationsansatz mit Hilfe 
des Wizard Plus Minipreps DNA Purification System (Promega) auf- 
gereinigt. Dabei wurde anstelle von Bakterien der Ligationsansatz 
eingesetzt. Die Elution der DNA erfolgte abweichend vom Her- 

30 stellerprotokoll in 30 fil (anstelle von 50 ul) Wasser. Die so 
aufgereinigte DNA wurde in einen Coating-Ansatz wie unter Bei- 
spiel 4 beschrieben eingesetzt (es wurden dann entsprechend 
weniger als die oben angegebenen 55 \il Wasser eingesetzt) . Die 
DNA wurde sodann wie unter Beispiel 4 beschrieben auf Tabak 

35 (Nicotiana tabacum cv. Petit Havanna CB199NTH X CB193NTH) Blatter 
geschossen. Abweichend zu den Angaben in Beispiel 4 erfolgt die 
Selektion auf 30, 50 oder 100 mg/L Kanamycin. 

Beispiel 13: Erstellen eines weiteren Vektors (pCB456-2) fur die 
40 Einbringung einer nicht naturlicherweise vorkommenden 

Erkennungsregion fur die Homing Endonuklease I-Ppol 
und RE-Sequenzen (attB) fur die Rekombinasen <>C31 und 
TP901-1 in das Plastom von Tabak 

45 Ziel dieses Ansatzes war es (analog zu Beispiel 3) einen weiteren 
Vektor fur die Plastidentransf ormation zu erstellen, welcher 
keine umfassenden Homologien zu Seguenzen im Plastidengenoro 
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besitzt. Der Selektionsmarker aadA ist in diesem Plasmid unter 
Kontrolle eines synthetischen Promotors, der abgeleitet ist von 
der Konsensus Sequenz fiir E. coli C70 Promotoren. Als 3'Ende 
wurde ein Bereich stromabwarts des 3'psbA-l Gens aus Synecho- 
5 cystis genutzt. Im Unterschied zu dem bereits beschriebenen 
Vektor pCB199-3 wurde hier die RE-Sequenz direkt stromabwarts 
des aadA Gens, aber stromauf warts der 3'psbA-l Sequenz aus 
Synechocystis in das Molekul eingefiihrt. Damit kann man nach 
Insertion einer Insertionssequenz mit Hilfe einer Rekombinase 

10 ein Operon erstellen. Die Gene auf der Insertionssequenz konnen 
dann - optional - ohne Promotor auf der Insertionssequenz inser- 
tiert werden. Nach der Insertion gelangen entsprechende Gene der 
Insertionssequenz dann auch unter Kontrolle des synthetischen 
Promotors stromaufwarts des aadA Gens in der Masterpf lanze . 

15 Dadurch kann man - optional - eine Operon Struktur bestehend 
aus dem aadA und den nachfolgend eingefuhrten Genen im Plastom 
erzeugen. 

Zur Herstellung des Plasmides pCB456-2 wurden sukzessive 
20 verschiedene Elemente in den Basisvektor pCB42-94 kloniert: 

a) Synthetischer Promotor (komplementar bp 1226-1260) 

b) Ribosomenbindestelle (komplementar bp 1214-1218) 

c) aadA Gen (komplementar bp 414-1208) 

25 d) C ore -Erkennungs region fiir die Homing Endonuklease I-Ppol 
(komplementar bp 331-345) 

e) attB RE-Sequenz fiir die Rekombinasen (j)C31 (bp 285-324) und 
TP901-1 (komplementar bp 276-176) 

f) 3'psbA-l aus Synechocystis (komplementar bp 19-155) 

30 

Der so erhaltene Vektor vermittelt auch in E. coli eine Spectino- 
mycin Resistenz. Anstelle der multiplen Klonierungsstelle im 
Basisvektor pCB42-94 (SEQ ID NO: 1) fiir die Plastidentrans- 
formation enthalt dieser Vektor mit der Bezeichnung pCB456-2 die 
35 aufgefiihrten Elemente im Rahmen der Nukleinsauresequenz mit der 
SEQ ID NO: 50. Auch hier ist die gesamte MCS ersetzende Sequenz 
(von Sac I bis Kpnl) angegeben. 

Beispiel 14: Erstellen von iiberwiegend homotransplastomen Master - 
40 pflanzen, die eine nicht natiirliche DSB-Erkennungs- 

sequenz und nicht natiirliche RE-Sequenzen (attB) ent- 
halten 

Analog zu pCB199-3 in Beispiel 4 wurde der Vektor pCB456-2 in die 
45 Plastiden von Tabak eingebracht. Abweichend von der Beschreibung 
in Beispiel 4 wurden die erhaltenen Sprosse jedoch auf Anzucht- 
medium, welches 30 g/L Saccharose enthielt (anstelle der in Bei- 
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spiel 4 angegebenen 10 g/L) , kultiviert. Die resultierenden 
Pflanzen wurden mit CB456NTH bezeichnet. Mittels Southern- 
Hybridisierung wurden von den Spectinomycin resistenten Pflanzen, 
die nach der Transformation erhalten wurden, 2 Linien (CB456NTH-1 
5 und -15) identifiziert, die die Insertionssequenz aus pCB456-2 
in ihr Plastom eingebaut haben. In dem Southern-Experiment wurde 
eine Sonde genutzt (SEQ ID NO: 58), welche gegen ein Fragment der 
16SrDNA gerichtet war. Diese Sonde war geeignet, urn aus mit EcoRI 
verdauter DNA, die dem Wildtyp entspricht, ein Fragment von etwa 
10 3,1 kb nachzuweisen. Im Gegensatz dazu wurde ein etwa 1,7 kb 
groSes Fragment detektiert, wenn in die entsprechenden Plastom- 
kopien die Insertionssequenz aus pCB456-2 eingebaut worden war 
(siehe Fig. 11) . 

15 Beispiel 15: Erstellen einer Sequenz der TP901-1 Rekombinase 
mit modifizierter Aminosauresequenz 



Mit pCBl27-2 als Matrize und den Oligonukleotiden p354 
(SEQ ID NO: 51) sowie p355 (SEQ ID NO: 52) als Primer wurde 

20 eine PCR-Reaktion durchgeftihrt, um eine Ribosomoenbindes telle 

stromauf warts der fur die TP901-1 Rekombinase kodierenden Sequenz 
einzubauen und die beschriebene Abweichung in der Aminosaure- 
sequenz (siehe Beispiel 5.2) zu korrigieren. Der amplif izierte 5 y 
Bereich der Rekombinase wurde in pCR4Blunt TOPO (Invitrogen) 

25 kloniert und anschlieSend als SpeI\HindIII Fragment in den 
mit Xbal und Hindlll behandelten Vektor pCB127-2 ligiert. Der 
resultierende Vektor wurde pCB487-20 genannt. Das Insert in 
diesem Vektor wird durch SEQ ID NO: 60 beschrieben. Er umfasst 
eine Ribosomenbindestelle und kodiert fur die TP901-1 Rekombinase 

30 (mit nativer Aminosauresequenz; SEQ ID NO: 61) . 

p3 54 : 5 ' -CGGATCCGGAGGCATCATGACTAAGAAAGTAGCAATCTATACACG-3 ' 

(SEQ ID NO: 51) 

35 p355: 5 ' -ATAAGCTTTATTCTCGATATCG-3 ' (SEQ ID NO: 52) 

Beispiel 16: Erstellen eines Vektors, der fur die Integration mit 
Hilfe von Rekombinasen in das Plastom von Master- 
pflanzen CB456NTH geeignet ist und zusatzlich einen 
40 Schnitt durch ein DSBI-Enzym ermSglicht 

Sukzessive wurden die verschiedenen Elemente, die fur einen sol- 
chen Vektor notwendig sind, in das Ruckgrat des pBLUESCRIPT klo- 
niert. Die angegebene Sequenz ersetzt die multiple Klonierungs- 
45 stelle des pBLUESCRIPT von Kpnl bis Sad. Das Ruckgrat des 
Vektors entspricht dem des pBLUESCRIPT . Der erhaltene Vektor 
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wurde mit pCB557-l bezeichnet. Das Insert wird durch 

SEQ ID No: 53 beschrieben und umfasst nachfolgende Elemente: 

a) Position Basenpaar 150-460: homologe Region zu Plastom- 

5 sequenzen der Masterpf lanze CB456NTH - nach der Integration 

der hier betrachteten Insertionsseguenz mittels <&C31 oder 
TP901 Rekombinase liegt dieser Bereich dupliziert als 
direkter „repeat" (gleiche Orientierung) zu den homologen 
Sequenzen aus CB456NTH vor. Dies erlaubt die intrachromo- 

10 somale Rekombination nach der Insertion der Insertionsse- 

guenz, was zur Eliminierung der I-Ppol Erkennungsregion aus 
den bereits durch Insertion modif izierten Plastomkopien der 
Masterpf lanze fuhrt. In dieser Region homolog zu Sequenzen in 
CB456NTH enthalten sind von Basenpaar 150-244 (komplementar) 

15 Teile des offenen Leserahmens 131 (0RF131) sowie von Basen- 

paar 337-431 das trnV Gen aus dem Tabakplastom der Master- 
pf lanzen. 

b) attP Region der TP901 Rekombinase (bp 7-85) 

c) attP Region der <j>C3lRekombinase (komplementar bp 96-145) 
20 d) Synthetischer Promotor (bp 462-495) 

e) Ribosomenbindestelle (bp 514-518) 

f) nptll Gen (bp 523-1326) 

g) Ribosomenbindestelle (bp 1333-1337) 

h) I-Ppol codierendes Gen (bp 1342-1833) 

25 Beispiel 17 Erstellen eines Vektors, der fur die Integration mit 
Hilfe von Rekombinasen in das Plastom von Master- 
pflanzen CB456NTH geeignet ist und keinen zusatz- 
lichen Schnitt durch ein DSBI-Enzym erm6glicht 



30 Zum Vergleich zu pCB557-l wurde ein Vektor erstellt, dessen 

Insertionsseguenz fur kein funktionelles DSBI-Enzym mehr kodiert. 
Dieser Vektor wurde wie folgt erstellt. Vektor pCB557-l wurde 
mit dem Restriktionsenzym Eco0109l behandelt. Dadurch wurde ein 
230 bp Fragment aus dem Gen kodierend fur die Homing-Endonuklease 

35 I-Ppol entfernt. Der verbleibende Vektoranteil wurde in einer 
Ligationsreaktion wieder rezirkularisiert. Der resultierende 
Vektor wurde pCB559-6 genannt. 

Beispiel 15 Erstellen eines Vektors zur transienten Expression 
40 der <(>C31 Rekombinase in Plastiden 

Urn die <(>C31-Rekombinase transient in Plastiden exprimieren zu 
kSnnen, wurde diese in dem Vektor pCB554-3 stromabwarts eines 
synthetischen Promotors kloniert. Im Vektor pCB554-3 sind die 
45 folgenden funktionellen Elemente vorhanden. 
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a) Synthetischer Promotor (bp 28-62) 

b) Ribosomenbindestelle (bp 70-74) 

c) Gen kodierend far die *C31 Rekombinase (bp 79-1920) 

5 Das Insert in pCB554-3 ist durch SEQ ID NO: 54 beschrieben. 
Das Vektorruckgrat entspricht dem des pBLUESCRIPT. 

Beispiel 16: Erstellen eines in vitro PCR-Produktes zur transien- 
ten, plastidaren Expression der TP901-Rekombinase 

10 

Das Gen kodierend fur die TP901-1 Rekombinase aus pCB487-20 wurde 
in geeigneter Orientierung mit einem synthetischen Promotor 
fusioniert. Anschliefiend wird das Fusionsprodukt mittels PCR 
amplifiziert; das entstehende Produkt wird mit PCR TP-Rek 
15 bezeichnet. Die in der PCR einzusetzenden Primer p268 

(SEQ ID NO: 55) und p72 (SEQ ID NO: 56) haben die Sequenz: 

p268: TCGACTTGACATTCACTCTTCAATTATCTATAATGATACATG (SEQ ID NO: 55) 
p72: CCTCGAGCTGCAGTTAAGCGAGTTGG (SEQ ID NO: 56) 

20 

Das resultierende PCR Produkt (TP-Rek) umfasst 1527 bp 
(SEQ ID NO: 57) und umfasst folgende Elemente: 

a) Synthetischer Promotor (bp 6-40) 
25 b) Ribosomenbindestelle (bp 48-52) 

c) Gen kodierend fur die TP901 Rekombinase (bp 57-1514) 

Beispiel 17: Transf ormationen von CB456NTH Masterpf lanzen 

zur Integration einer Insertionssequenz mittels 
30 Erkennungsstellen-spezifischer Rekombination 

In diesen Versuchen soli die Insertionssequenz oder das gesamte 
Insertionskonstrukt durch die transiente Expression der Rekombi- 
nase in Plastiden in die Plastomsequenz der Masterpf lanzen 

35 CB456NTH eingebaut werden. Das Aufbringen der entsprechenden 
DNA auf die Goldpartikel erfolgt analog zu Beispiel 4. Folgende 
Kombinationen von DNA werden jeweils gleichzeitig in die 
Plastiden der Masterpf lanzen CB456NTH eingebracht. Wird nur 
die Insertionssequenz in die Plastiden eingebracht, wird diese 

40 zunachst wie in Beispiel 12 beschrieben in vitro aus dem Inser- 
tionskonstrukt heraus geschnitten (im Fall von pCB559-6 und 
PCB557-1 erfolgt dies mit Hilfe der Restriktionsendonuklease 
Kpnl) und zirkularisiert . Wird das gesamte, uribehandelte Inser- 
tionskonstrukt in der Transformation eingesetzt, wird auch das 

45 Vektorruckgrat in die Plastiden eingebaut. 
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Der Transformationsprozess mittels Partikelkanone erfolgt 
15 im wesentlichen wie in Beispiel 14 far die Erstellung von 
CB456NTH beschrieben. Als wesentliche Unterschiede zu der 
obigen Beschreibung wird das Beschussmedium durch Regenerations- 
medium ersetzt und anstelle von Spectomycin wird Kanamycin als 
selektives Agens genutzt. In Kurze: Die beschossenen Explantate 
20 verbleiben fur 2 Tage auf Regenerationsmedium und werden 

anschliefiend in etwa 0,5 cm2 groSe Segmente zerschnitten. Diese 
werden fur 4 bis 6 Wochen auf Regenerationsmedium zuzaglich 
30mg/L Kanamycin inkubiert. Anschliefcend werden die Explantate 
far 7 bis 10 Wochen auf Regenerationsmedium zuzaglich 50 mg/L 
25 Kanamycin inkubiert. Danach werden die Explantate - optional - 
auf Regenerationsmedium zuzaglich 80mg/L Kanamycin inkubiert. 
Entstehende Pflanzen werden wiederum auf Anzuchtmedium (zuzag- 
lich Kanamycin) gesetzt bis sie Wurzeln bilden. Die Bewurzelung 
kann ggf. auch in Abwesenheit des selektiven Agenz erfolgen. 
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Patentanspruche 

1. Verfahren zur sequenzspezif ischen Integration einer DNA- 
Sequenz in die plastidare DNA eines pflanzlichen Organismus 
oder von diesem abgeleitete Zellen, dadurch gekennzeichnet, 
dass 

a) die plastidaren DNA-Mo 1 ekul e des besagten pflanzlichen 
Organismus oder von diesem abgeleitete Zelle mindestens 
eine Rekombinaseerkennungssequenz Rl enthalten und 

b) i) mindestens ein Transf ormationskonstrukt umfassend 

eine Insertionssequenz zumindest einseitig flankiert 
; von mindestens einer weiteren Rekombinationssequenz 

R2 sowie 

ii) mindestens eine sequenzspezif ische Rekombinase 

geeignet zur Induktion von Rekombinationsereignissen 
i an besagten Rekombinationssequenzen Rl und R2 

in mindestens einem Plastid besagten pflanzlichen 
Organismus oder von diesem abgeleiteten Zellen zusammen- 
gebracht werden, und 

c) die Insertionssequenz in die plastidare DNA unter 
Rekombination von Rl mit R2 insertiert, und 

d) Pflanzen oder Zellen isoliert werden, bei denen die 
i Insertionssequenz in die plastidaren DNA-Molekiile 

insertiert wurde. 

2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass die 
Funktionalitat der durch Rekombination von Rl mit R2 ent- 

i stehenden Rekombinationssequenzen so vermindert wird, dass 
die Insertion der Insertionssequenz gegenuber der Excision 
derselben urn mindestens den Faktor zehn bevorzugt ist. 
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3. Verfahren nach einem der Anspruche 1 oder 2, dadurch gekenn- 
zeichnet, dass das Transf ormationskonstrukt mindestens eines 
der nachf olgenden Elemente beinhaltet 

5 i) Expressionskassette fur eine Rekombinase 

ii) Positiven Selektionsmarkem 

iii> Negativen Selektionsmarkem 

10 

iv) Reportergenen 

v) Replikationsursprungen 

15 vi) Multiple Klonierungsregionen 

vii) "Border"-Sequenzen fur Agrobakterium-Transf ektion 

viii) Sequenzen, die eine homologe Rekombination bzw. 
20 Insertion in das Genom eines Wirtsorganismus 

ermoglichen 

ix) Expressionskassette fur ein Enzym, geeignet zur 
Induktion von DNA-Doppelstrangbriichen an der 

25 Erkennungsseguenz zur gezielten Induktion von 

DNA-Doppelstrangbruchen 

4. Verfahren nach einem der Anspruche 1 bis 3, dadurch gekenn- 
zeichnet, dass die Rekombinase ausgewahlt ist aus der Gruppe 

30 der Rekombinasen bestehend aus Cre, Flp, 4>C31 Rekombinase, 

TP901-1 Rekombinase, Gin, Cin, Pin, X-Rekombinase , R4 Inte- 
grase und Hin Invertase. 

5. Verfahren nach einem der Anspruche 1 bis 4, dadurch gekenn- 
35 zeichnet, dass die Rekombinase als Fusionsprotein mit einer 

Plastidenlokalisationssecjuenz exprimiert wird. 

6. Verfahren nach einem der Anspruche 1 bis 5, dadurch gekenn- 
zeichnet, dass die Rekombinase kodiert ist durch eine Sequenz 

40 gemaS SEQ ID NO: 41, 42, 46 oder 47. 

7. Expressionskassette enthaltend eine Nukleinsauresequenz 
kodierend fur eine Rekombinase ausgewahlt aus der Gruppe der 
Resolvasen/Invertasen unter Kontrolle eines in pflanzlichen 

45 Plastiden aktiven Promotors. 
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8. Expressionskassette enthaltend eine Nukleinsauresequenz 
kodierend fur Fusionsprotein aus einer Plastiden- 
lokalisationssequenz und einer Rekombinase ausgewahlt 
aus der Gruppe der Resolvasen/Invertasen unter Kontrolle 

5 eines im pf lanzlichen Zellkern aktiven Promotors. 

9. Expressionskassette nach einem der Anspruche 7 oder 8, 
dadurch gekennzeichnet , dass die Rekombinase ausgewahlt 
ist aus der Gruppe bestehend aus <&C31 Rekombinase, R4 

10 Rekombinase, Hin Rekombinase, TP901-1 Rekombinase, Gin, 

Cin und Pin. 

10. Pflanzlicher Organismus erhalten nach einem Verfahren gemaS 
einem der Anspruche 1 bis 6. 

15 

11. Pflanzlicher Organismus enthaltend eine Expressionskassette 
gemafi einem der Anspruche 7 bis 9. 

12. Pflanzlicher Organismus nach einem der Anspruche 10 oder 11 
20 ausgewahlt aus der Gruppe bestehend aus Arabidopsis thaliana, 

Tabak, Tagetes, Weizen, Roggen, Gerste, Hafer, Raps, Mais, 
Kartoffel, Zuckerrube, Soja, Sonnenblume, Kurbis oder Erd- 
nuss . 

25 13. Zellkulturen, Organe, Gewebe, Teile oder transgenes Ver- 
mehrungsgut abgeleitet von einem pflanzlichen Organismus 
nach den Ansprtichen 10 bis 12 . 

14. Verwendung eines Organismus nach einem der Anspruche 10 bis 
30 12 oder von diesem abgeleitete Zellkulturen, Organe, Gewebe, 

Teile oder transgenes Vermehrungsgut nach Anspruch 13 als 
Nahrungs-, Futtermittel oder Saatgut oder zur Herstellung 
von Pharmazeutika oder Feinchemikalien. 

35 
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Fig. 1B 
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Fig. 4 
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Fig. 5 
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Fig. 9 
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1 

SEQUENZ PROTOKOLL 

<110> SunGene GmbH & Co.KGaA 

<120> Verfahren zur Transformation von pflanzlichen Plastiden 

<130> PF0817000029 

<140> 
<141> 

<160> 61 

<170> Patentln Ver. 2.1 

<210> 1 
<211> 4363 
<212> DNA 

<213> Ktinstliche Seguenz 
<220> 

.<223> Besctoeibung_der k^nstlichen Seguenz: plastid 
transformation plasmid pCB42-94 

<220> 

<221> misc_feature 
<222> (55).. (1405) 
<223> right targeting region 

<220> 

<221> mutation 
<222> (346) 

<223> mutation causing streptomycin resistence 
<220> 

<221> mutation 
<222> (68) 

<223> mutation causing spectinomycin resistence 
<220> 

<221> misc_feature 

<222> (1404) . . (1511) 

<223> multiple cloning site 

<220> 

<221> misc_feature 
<222> (2629) . . (3417) 
<223> Ampicilin resistence 

<400> 1 

gcgcccaata cgcaaaccgc ctctccccgc gcgttggccg attcattaat gcagtgatga 60 

cttgacggca tcctcacctt cctccggctt atcaccggca gtctgttcag ggttccaaac 120 

tcaacgatgg caactaaaca cgagggttgc gctcgttgcg ggacttaacc caacacctta 180 

cggcacgagc tgacgacagc catgcaccac ctgtgtccgc gttcccgaag gcacccctct 240 

ctttcaagag gattcgcggc atgtcaagcc ctggtaaggt tcttcgcttt gcatcgaatt 300 

aaaccacatg ctccaccgct tgtgcgggcc cccgtcaatt ccttttagtt tcattcttgc 360 

gaacgtactc cccaggcggg atacttaacg cgttagctac agcactgcac gggtcgatac 420 

gcacagcgcc tagtatccat cgtttacggc taggactact ggggtatcta atcccattcg 480 

ctcccctagc tttcgtctct cagtgtcagt gtcggcccag cagagtgctt tcgccgttgg 540 

tgttctttcc gatctctacg catttcaccg ctccaccgga aattccctct gcccctaccg 600 

tactccagct tggtagtttc caccgcctgt ccagggttga gccctgggat ttgacggcgg 660 

acttaaaaag ccacctacag acgctttacg cccaatcatt ccggataacg cttgcatcct 720 

ctgtattacc gcggctgctg gcacagagtt agccgatgct tattccccag ataccgtcat 780 

tgcttcttct ccgggaaaag aagttcacga cccgtgggcc ttctacctcc acgcggcatt 840 

gctccgtcag gctttcgccc attgcggaaa attccccact gctgcctccc gtaggagtct 900 
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gggccgtgtc tcagtcccag tgtggctgat 
cttggtaagc tattgcctca ccaactagct 
tcctcctttt gctcctcagc ctacggggta 
cccaagggca ggttcttacg cgttactcac 
ccgacttgca tgtgttaagc atgccgccag 
atgagattca tagttgcatt acttatagct 
ttgtctttca ttccaaggca taacttgtat 
tcccagaaat atagccatcc ctgccccctc 
tcattgaacg acggcggggg agcgagctcc 
gatcccccgg gctgcaggaa ttcgatatca 
ggcccggtac caaatccaac tagaaaaact 
actgatgact tccaccacgt caaggtgaca 
cccatcgaga aatagaactg actaatccta 
attcttgaac aacttggagc cgggccttct 
gtcaaaatcg gattcaattg tcaactgccc 
gaaggaactg gagttacatc tcttttccat 
ttgagacccc gaaaaatgga caaattcctt 
acaaaaagga taatggtaac cctaccatta 
gaaatacatg tcctaccgag acagaatttg 
agatttacct ccgtggaaag gatgattcat 
ccagaatcca tgttgtatat ttgaaagagg 
cctcttcccg ccgagcccct tttctcctcg 
caacaattca tcagactcac taagtcggga 
tctaatatat ctaatataat agaaaatact 
atactttccc cggttccgtt gctaccgagg 
atgtcatgat aataatggtt tcttagacgt 
gaacccctat ttgtttattt ttctaaatac 
aaccctgata aatgcttcaa taatattgaa 
gtgtcgccct tattcccttt tttgcggcat 
cgctggtgaa agtaaaagat gctgaagatc 
tggatctcaa cagcggtaag atccttgaga 
tgagcacttt taaagttctg ctatgtggcg 
agcaactcgg tcgccgcata cactattctc 
cagaaaagca tcttacggat ggcatgacag 
tgagtgataa cactgcggcc aacttacttc 
ccgctttttt gcacaacatg ggggatcatg 
tgaatgaagc cataccaaac gacgagcgtg 
cgttgcgcaa actattaact ggcgaactac 
actggatgga ggcggataaa gttgcaggac 
ggtttattgc tgataaatct ggagccggtg 
tggggccaga tggtaagccc tcccgtatcg 
ctatggatga acgaaataga cagatcgctg 
aactgtcaga ccaagtttac tcatatatac 
ttaaaaggat ctaggtgaag atcctttttg 
agttttcgtt ccactgagcg tcagaccccg 
ctttttttct gcgcgtaatc tgctgcttgc 
tttgtttgcc ggatcaagag ctaccaactc 
cgcagatacc aaatactgtc cttctagtgt 
ctgtagcacc gcctacatac ctcgctctgc 
gcgataagtc gtgtcttacc gggttggact 
ggtcgggctg aacggggggt tcgtgcacac 
aactgagata cctacagcgt gagctatgag 
cggacaggta tccggtaagc ggcagggtcg 
ggggaaacgc ctggtatctt tatagtcctg 
gatttttgtg atgctcgtca ggggggcgga 
ttttacggtt cctggccttt tgctggcctt 



2 

catcctctcg gaccagctac tgatcatcgc 960 
aatcagacgc gagcccctcc tcgggcggat 1020 
ttagcagccg tttccagctg ttgttcccct 1080 
ccgtccgcca ctggaaacac cacttcccgt 1140 
cgttcatcct gagccaggat cgaactctcc 1200 
tccttgttcg tagacaaagc ggattcggaa 1260 
ccatgcgctt catattcgcc cggagttcgc 1320 
acgtcaatcc cacgagcctc ttatccattc 1380 
accgcggtgg cggccgctct agaactagtg 1440 
agcttatcga taccgtcgac ctcgaggggg 1500 
cacattgggc ttagggataa tcaggctcga 1560 
ctctaccgct gagttatatc ccttccccgc 1620 
agtcaaaggg tcgagaaact caacgccact 1680 
tttcgcacta ttacggatat gaaaataatg 1740 
ctatcggaaa taggattgac taccgattcc 1800 
tcaagagttc ttatgcgttt ccacgcccct 1860 
ttcttaggaa cacatacaag attcgtcact 1920 
actacttcat ttatgaattt catagtaata 1980 
gaacttgcta tcctcttgcc tagcaggcaa 2040 
tcggatcgac atgagagtcc aactacattg 2100 
ttgacctcct tgcttctctc atggtacact 2160 
gtccacagag acaaaatgta ggactggtgc 2220 
tcactaacta atactaatct aatataatag 2280 
aatataatag aaaagaactg tcttttctgt 2340. 
gcctcgtgat acgcctattt ttataggtta 2400 
caggtggcac ttttcgggga aatgtgcgcg 2460 
attcaaatat gtatccgctc atgagacaat 2520 
aaaggaagag tatgagtatt caacatttcc 2580 
tttgccttcc tgtttttgct cacccagaaa 2640 
agttgggtgc acgagtgggt tacatcgaac 2700 
gttttcgccc cgaagaacgt tttccaatga 2760 
cggtattatc ccgtattgac gccgggcaag 2820 
agaatgactt ggttgagtac tcaccagtca 2880 
taagagaatt atgcagtgct gccataacca 2940 
tgacaacgat cggaggaccg aaggagctaa 3000 
taactcgcct tgatcgttgg gaaccggagc 3060 
acaccacgat gcctgtagca atggcaacaa 3120 
ttactctagc ttcccggcaa caattaatag 3180 
cacttctgcg ctcggccctt ccggctggct 3240 
agcgtgggtc tcgcggtatc attgcagcac 3300 
tagttatcta cacgacgggg agtcaggcaa 3360 
agataggtgc ctcactgatt aagcattggt 3420 
tttagattga tttaaaactt catttttaat 3480 
ataatctcat gaccaaaatc ccttaacgtg 3540 
tagaaaagat caaaggatct tcttgagatc 3600 
aaacaaaaaa accaccgcta ccagcggtgg 3660 
tttttccgaa ggtaactggc ttcagcagag 3720 
agccgtagtt aggccaccac ttcaagaact 3780 
taatcctgtt accagtggct gctgccagtg 3840 
caagacgata gttaccggat aaggcgcagc 3900 
agcccagctt ggagcgaacg acctacaccg 3960 
aaagcgccac gcttcccgaa gggagaaagg 4020 
gaacaggaga gcgcacgagg gagcttccag 4080 
tcgggtttcg ccacctctga ettgagcgtc 4140 
gcctatggaa aaacgccagc aacgcggcct 4200 
ttgctcacat gttctttcct gcgttatccc 4260 
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ctgattctgt ggataaccgt attaccgcct ttgagtgagc tgataccgct cgccgcagcc 4320 
gaacgaccga gcgcagcgag tcagtgagcg aggaagcgga aga 4363 

<210> 2 
<211> 1359 
<212> DNA 

<213> Ktxnstliche Seguenz 
<220> 

<223> Beschreibung der kiinstlichen Sequenz: Insert of 
vector pCB199-3 

<400> 2 

gagctctgat cacggaagat agctttggca aaaaaagcaa aaagcattta ccttgattga 60 
gatgttaatt gtgttggcaa ttatcagtat tttaattttg ctttttgtgc caaatttgat 120 
actagagctt cgggtgccag ggcgtgccct tgggctcccc gggcgcgtac tcgacgctac 180 
cttaagagag tcaagcttct atattaccct gttatcccta gcgtactcga gaaaaaaaga 240 
aaggagcaat agcaccctct tgatagaaca agaaaatgat tattgctcct ttcttttcaa 300 
aacctcctat agactaggcc aggaattatc tgcagttatt tgccaactac cttagtgatc 360 
tcgcctttca cgtagtggac aaattcttcc aactgatctg cgcgcgaggc caagcgatct 420 
tcttcttgtc caagataagc ctgtctagct tcaagtatga cgggctgata ctgggccggc 480 
aggcgctcca ttgcccagtc ggcagcgaca tccttcggcg cgattttgcc ggttactgcg 540 
ctgtaccaaa tgcgggacaa cgtaagcact acatttcgct catcgccagc ccagtcgggc 600 
ggcgagttcc atagcgttaa ggtttcattt agcgcctcaa atagatcctg ttcaggaacc 660 
ggatcaaaga gttcctccgc cgctggacct accaaggcaa cgctatgttc tcttgctttt 720 
gtcagcaaga tagccagatc aatgtcgatc gtggctggct cgaagatacc tgcaagaatg 780 
tcattgcgct gccattctcc aaattgcagt tcgcgcttag ctggataacg ccacggaatg 840 
atgtcgtcgt gcacaacaat ggtgacttct acagcgcgga gaatctcgct ctctccaggg 900 
gaagccgaag tttccaaaag gtcgttgatc aaagctcgcc gcgttgtttc atcaagcctt 960 
acggtcaccg taaccagcaa atcaatatca ctgtgtggct tcaggccgcc atccactgcg 1020 
gagccgtaca aatgtacggc cagcaacgtc ggttcgagat ggcgctcgat gacgccaact 1080 
acctctgata gttgagttga tacttcggcg ataaccgctt cacgagccat ggctgtttgt 1140 
ggtgtcatgg ctgtttgtgg tgtcatgaat ccctccctac aactagatcc tcgcccggag 1200 
ttcgctccca gaaatatagc catccctgcc ccctcacgtc aatcccacga gcctcttatc 1260 
cattctcatt gaacgacggc gtcgaggggg ggcccggtac gtcgacgaag ttcctattcc 1320 
gaagttccta ttctcaagaa agtataggaa cttcgtacc 1359 
<210> 3 
<2U> 1070 
<212> DNA 

<213> Rtinstliche Sequenz 
<220> 

<223> Beschreibung der Jrfinstlichen Seguenz: insert of 

vector pCB401-20 
<400> 3 

gagctctgat cacggaagat agctttggca aaaaaagcaa aaagcattta ccttgattga 60 
gatgttaatt gtgttggcaa ttatcagtat tttaattttg ctttttgtgc caaatttgat 120 
actagagctt cgggtgccag ggcgtgccct tgggctcccc gggcgcgtac tcgacgctac 180 
cttaagagag tcaagcttct atattaccct gttatcccta gcgtactcga gctgcagtta 240 
tttgccaact accttagtga tctcgccttt cacgtagtgg acaaattctt ccaactgatc 300 
tgcgcgcgag gccaagcgat cttcttcttg tccaagataa gcctgtctag cttcaagtat 360 
gacgggctga tactgggccg gcaggcgctc cattgcccag tcggcagcga catccttcgg 420 
cgcgattttg ccggttactg cgctgtacca aatgcgggac aacgtaagca ctacatttcg 480 
ctcatcgcca gcccagtcgg gcggcgagtt ccatagcgtt aaggtttcat ttagcgcctc 540 
aaatagatcc tgttcaggaa ccggatcaaa gagttcctcc gccgctggac ctaccaaggc 600 
aacgctatgt tctcttgctt ttgtcagcaa gatagccaga tcaatgtcga tcgtggctgg 660 
ctcgaagata cctgcaagaa tgtcattgcg ctgccattct ccaaattgca gttcgcgctt 720 
agctggataa cgccacggaa tgatgtcgtc gtgcacaaca atggtgactt ctacagcgcg 780 
gagaatctcg ctctctccag gggaagccga agtttccaaa aggtcgttga tcaaagctcg 840 
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ccgcgttgtt tcatcaagcc ttacggtcac cgtaaccagc aaatcaatat cactgtgtgg 900 

cttcaggccg ccatccactg cggagccgta caaatgtacg gccagcaacg tcggttcgag 960 

atggcgctcg atgacgccaa ctacctctga tagttgagtt gatacttcgg cgataaccgc 1020 

ttcacgagcc atggttccct ccctacaacg tcgagggggg gcccggtacc 1070 

<210> 4 
<211> 520 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kiinstlichen Sequenz: synthetic 
sequence coding for I-Ppo I homing-endonuclease 

<220> 

<221> CDS 

<222> (16).. (504) 

<400> 4 

gcatatgaga tctcc atg gcg etc acc aat get caa ate ttg get gtg att 51 
Met Ala Leu Thr Asn Ala Gin lie Leu Ala Val lie 
15 10 
gac agt tgg gaa gaa aca gtc ggt cag ttt cca gtg ata acg cac cat 99 
Asp Ser Trp Glu Glu Thr Val Gly Gin Phe Pro Val lie Thr His His 

15 20 25 

gta cca tta ggt ggc ggt ctg caa gga acg etc cat tgt tac gag ate 147 
Val Pro Leu Gly Gly Gly Leu Gin Gly Thr Leu His Cys Tyr Glu He 

30 35 40 

cce eta gca get cct tat ggg gtt ggc ttt get aag aat ggg cct acc 195 
Pro Leu Ala Ala Pro Tyr Gly Val Gly Phe Ala Lys Asn Gly Pro Thr 
45 50 55 60 

cgc tgg caa tac aaa egg aca ate aat caa gtc gtc cac aga tgg ggg 243 
Arg Trp Gin Tyr Lys Arg Thr He Asn Gin Val Val His Arg Trp Gly 
65 70 75 

' tec cac-'aca-gtc cct ttt eta tta gaa ccg gat aac ate aac ggc- aaa- -291 
Ser His Thr Val Pro Phe Leu Leu Glu Pro Asp Asn He Asn Gly Lys 

80 85 90 

acc tgc aca gca teg cac eta tgt cat aat act cga tgc cac aat ccc 339 
Thr Cys Thr Ala Ser His Leu Cys His Asn Thr Arg Cys His Asn Pro 

95 100 105 

ttg cac ttg tgc tgg gag tea eta gac gac aac aaa ggc aga aac tgg 387 
Leu His Leu Cys Trp Glu Ser Leu Asp Asp Asn Lys Gly Arg Asn Trp 

HO 115 120 

tgc ccc ggt ccc aac ggg gga tgt gtc cat gcg gtg gtt tgt tta agg 435 
Cys Pro Gly Pro Asn Gly Gly Cys val His Ala Val Val Cys Leu Arg 
125 130 135 140 

cag ggt ccg ttg tac ggc cca ggg gcg act gtg gca ggt cct caa caa 483 
Gin Gly Pro Leu Tyr Gly Pro Gly Ala Thr Val Ala Gly Pro Gin Gin 

145 150 155 

agg ggc agt cac ttt gtg gta taactgeage tcgagg 520 
Arg Gly Ser His Phe Val Val 
160 

<210> 5 
<211> 163 
<212> PRT 
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<213> Kiinstliche Sequenz 

<223> Beschreibung der kiinstlichen Sequenz: synthetic 
sequence coding for I-Ppo I homing-endonuclease 

<400> 5 

Met Ala Leu Thr Asn Ala Gin lie Leu Ala Val He Asp Ser Trp Glu 

1 5 10 15 

Glu Thr Val Gly Gin Phe Pro Val He Thr His His Val Pro Leu Gly 

20 25 30 

Gly Gly Leu Gin Gly Thr Leu His Cys Tyr Glu He Pro Leu Ala Ala 

35 40 45 

Pro Tyr Gly val Gly Phe Ala Lys Asn Gly Pro Thr Arg Trp Gin Tyr 

50 55 60 

Lys Arg Thr He Asn Gin Val Val His Arg Trp Gly Ser His Thr Val 
65 70 75 80 

Pro Phe Leu Leu Glu Pro Asp Asn He Asn Gly Lys Thr Cys Thr Ala 

85 90 95 

Ser His Leu Cys His Asn Thr Arg Cys His Asn Pro Leu His Leu Cys 

100 105 HO 

Trp Glu Ser Leu Asp Asp Asn Lys Gly Arg Asn Trp Cys Pro Gly Pro 

115 120 125 

Asn Gly Gly Cys Val His Ala Val Val Cys Leu Arg Gin Gly Pro Leu 

130 135 140 

Tyr Gly Pro Gly Ala Thr Val Ala Gly Pro Gin Gin Arg Gly Ser His 
145 150 155 160 

Phe val Val 



<210> 6 
-<211> 21 ■ 
<212> DNA 

<213> Kiinstliche Sequenz 
<220> 

<223> Beschreibung der kiinstlichen Sequenz: 
oligonucleotide primer 



taaggccctc ggtagcaacg g 

<210> 7 
<211> 20 
<212> DNA 

<213> Kiinstliche Sequenz 
<220> 

<223> Beschreibung der kiinstlichen Sequenz: 
oligonucleotide primer 

<400> 7 

ggggtaccaa atccaactag 

<210> 8 
<211> 25 
<212> DNA 

<213> Kunstliche Sequenz 
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<220> 

<223> Beschreibung der kCLnstlichen Sequenz: 

oligonucleotide primer 
<400> 8 

ggagctcgct cccccgccgt cgttc 

<210> 9 
<211> 27 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kiinstlichen Sequenz: 

oligonucleotide primer 
<400> 9 

gatgcatgat gacttgacgg catcctc 
<210> 10 

<211> 175 

<212> DNA 

<213> Pisum sativum 

<220> 

<221> CDS 

<222> (1) . . (174) 

<223> plastid translocalization sequence 
<400> 10 

atg get tct atg ata tec tct tea get gtg act aca gtc age cgt get 
Met Ala Ser Met lie Ser Ser Ser Ala Val Thr Thr Val Ser Arg Ala 

15 10 15 

tct acg gtg caa teg gee gcg gtg get cca ttc ggc ggc etc aaa tec 
Ser Thr Val Gin Ser Ala Ala Val Ala Pro Phe Gly Gly Leu Lys Ser 

20 25 30 

atg act gga ttc cca gtt aag aag gtc aac act gac att act tec att 
Met Thr Gly Phe Pro Val Lys Lys Val Asn Thr Asp lie. Thr Ser . lie _ 

35 40 45 

aca age aat ggt gga aga gta aag tgc atg c 
Thr Ser Asn Gly Gly Arg Val Lys Cys Met 

50 55 
<210> 11 
<211> 58 
<212> PRT 

<213> Pisum sativum 
<400> 11 

Met Ala Ser Met He Ser Ser Ser Ala Val Thr Thr Val Ser Arg Ala 

1 5 10 15 

Ser Thr Val Gin Ser Ala Ala Val Ala Pro Phe Gly Gly Leu Lys Ser 

20 25 30 

Met Thr Gly Phe Pro Val Lys Lys Val Asn Thr Asp He Thr Ser He 

35 40 45 

Thr Ser Asn Gly Gly Arg Val Lys Cys Met 
50 55 



<210> 12 
<211> 84 
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7 

<212> PRT 

<213> Nicotiana tabacum 
<220> 

<221> TRANSIT 
<222> (1) . . (84) 

<223> plastidic translocalisation signal derived from 

plastidic transketolase 
<400> 12 



Met 
1 


Ala 


Ser 


Ser Ser 
5 


Ser Leu Thr 


Leu Ser 
10 


Gin 


Ala 


lie 


Leu Ser Arg 
15 


Ser 


val 


Pro 


Arg His 
20 


Gly Ser Ala 


Ser Ser 
25 


Ser 


Gin 


Leu 


Ser Pro Ser 
30 


Ser 


Leu 


Thr 
35 


Phe Ser 


Gly Leu Lys 
40 


Ser Asn 


Pro 


Asn 


He 
45 


Thr Thr Ser 


Arg 


Arg 
50 


Arg 


Thr Pro 


Ser Ser Ala 
55 


Ala Ala 


Ala 


Ala 
60 


Val 


Val Arg Ser 


Pro 
65 


Ala 


lie 


Arg Ala 


Ser Ala Ala 
70 


Thr Glu Thr 
75 


He 


Glu 


Lys Thr Glu 
80 


Thr 


Ala 


Gly 


Ser 















<210> 13 
<211> 258 
<212> DNA 

<213> Nicotiana tabacum 
<220> 

<221> trans it_peptide 
<222> (1) . . (258) 

<223> plastidic translocalisation signal derived from 
plastidic transketolase (frame 1) 

<400> 13 

ggtaccatgg cgtcttcttc ttctctcact ctctctcaag ctatcctctc tcgttctgtc 60 
cctcgccatg gctctgcctc ttcttctcaa ctttcccctt cttctctcac tttttccggc 120 
cttaaatcca atcccaatat caccacctcc cgccgccgta ctccttcctc cgccgccgcc 180 
gccgccgtcg taaggtcacc ggcgattcgt gcctcagctg caaccgaaac catagagaaa 240 
actgagactg cgggatcc 258 
<210> 14 
<211> 260 
<212> DNA 

<213> Nicotiana tabacum 
<220> 

<221> trans it_peptide 
<222> (1)..(260) 

<223> plastidic translocalisation signal derived from 

plastidic transketolase (frame 2) 
<400> 14 

ggtaccatgg cgtcttcttc ttctctcact ctctctcaag ctatcctctc tcgttctgtc 60 
cctcgccatg gctctgcctc ttcttctcaa ctttcccctt cttctctcac tttttccggc 120 
cttaaatcca atcccaatat caccacctcc cgccgccgta ctccttcctc cgccgccgcc 180 
gccgccgtcg taaggtcacc ggcgattcgt gcctcagctg caaccgaaac catagagaaa 240 
actgagactg cgctggatcc 260 

<210> 15 
<211> 259 
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<212> DNA 

<213> Nicotiana tabacum 
<220> 

<221> transit_peptide 
<222> (1) . . (259) 

<223> plastidic translocalisation signal derived from 
plastidic transketolase (frame 3) 

<400> 15 

ggtaccatgg cgtcttcttc ttctctcact ctctctcaag ctatcctctc tcgttctgtc 60 

cctcgccatg gctctgcctc ttcttctcaa ctttcccctt cttctctcac tttttccggc 120 

cttaaatcca atcccaatat caccacctcc cgccgccgta ctccttcctc cgccgccgcc 180 

gccgccgtcg taaggtcacc ggcgattcgt gcctcagctg caaccgaaac catagagaaa 240 
actgagactg cggggatcc 259 

<210> 16 
<211> 63 
<212> PRT 

<213> Arabidopsis thaliana 

<220> 

<221> TRANSIT 
<222> (1)..(63) 

<223> plastidic translocalisation signal derived from 
plastidic isopentenylpyrophosphate isomerase-2 
(IPP-2) 

<400> 16 
Met Ser Ala Ser 
1 

Leu Ala Leu Ser 
20 

Leu Ser Ser lie 

35 

Gly Thr Ala Met 

50- 

<210> 17 
<211> 205 
<212> UNA 
<213> Arabidopsis thaliana 

<220> 

<221> transit_peptide 
<222> (1) . . (205) 

<223> plastidic translocalisation signal derived from 
plastidic isopentenylpyrophosphate isomerase-2 
(IPP-2) (frame 1) 

<400> 17 

gatatccaca ccaacaccaa tgtctgcttc ttctttattt aatctcccat tgattcgcct 60 
cagatctctc gctctttcgt cttctttttc ttctttccga tttgcccatc gtcctctgtc 120 
atcgatttca ccgagaaagt taccgaattt tcgtgctttc tctggtaccg ctatgacaga 180 
tactaaagat ggatcccggg tcgac 205 
<210> 18 
<211> 207 
<212> DNA 

<213> Arabidopsis thaliana 
<220> 

<221> transit_peptide 



Ser Leu Phe Asn Leu Pro Leu He Arg Leu Arg Ser 

5 10 15 

Ser Ser Phe Ser Ser Phe Arg Phe Ala His Arg Pro 

25 30 
Ser Pro Arg Lys Leu Pro Asn Phe Arg Ala Phe Ser 

40 45 
Thr Asp Thr Lys Asp Gly Ser Arg Val Asp Met 
-55- 60 
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<222> (1) . . (207) 

<223> plastidic translocalisation signal derived from 
plastidic isopentenylpyrophosphate isomerase-2 
(IPP-2) (frame 2) 

<400> 18 

gatatccaca ccaacaccaa tgtctgcttc ttctttattt aatctcccat tgattcgcct 60 
cagatctctc gctctttcgt cttctttttc ttctttccga t.ttgcccatc gtcctctgtc 120 
atcgatttca ccgagaaagt taccgaattt tcgtgctttc tctggtaccg ctatgacaga 180 
tactaaagat ctggatcccg ggtcgac 207 
<210> 19 
<211> 206 
<212> DNA 

<213> Arabidopsis thaliana 
<220> 

<221> trans it_peptide 
<222> (1) . . (206) 

<223> plastidic translocalisation signal derived from 
plastidic isopentenylpyrophosphate isomerase-2 
(IPP-2) (frame 3) 

<400> 19 

gatatccaca ccaacaccaa tgtctgcttc ttctttattt aatctcccat tgattcgcct 60 
cagatctctc gctctttcgt cttctttttc ttctttccga tttgcccatc gtcctctgtc 120 
atcgatttca ccgagaaagt taccgaattt tcgtgctttc tctggtaccg ctatgacaga 180 
tactaaagat gggatcccgg gtcgac 206 

<210> 20 
<211> 44 
<212> DNA 

<213> Nicotiana tabacum 
<220> 

<221> promoter 
<222> (1) . . (44) 

_<223> plastidic promoter PrbcL 
<400> 20 

gttgcgctat atatatgaaa gagtatacaa taatgatgta tttg 44 
<210> 21 
<211> 64 
<212> DNA 

<213> Nicotiana tabacum 
<220> 

<221> promoter 
<222> (1) . . (64) 

<223> plastidic promoter Prpsl6-107 
<400> 21 

tagcgatggg gtcttactaa agaaaaatat ttatccacct atctctatag tatatagata 60 



64 



<210> 22 
<211> 91 
<212> DNA 

<213> Nicotiana tabacum 
<220> 

<221> promoter 
<222> (1)..(91) 

<223> plastidic promoter Prrnl6 
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<400> 22 

cgccgtcgtt caatgagaat ggataagagg ctcgtgggat tgacgtgagg gggcagggat SO 
ggctatattt ctgggagcga actccgggcg a 91 

<210> 23 
<211> 71 
<212> DNA 

<213> Arabidopsis thaliana 
<220> 

<221> promoter 
<222> (1) .. (71) 

<223> plastidic promoter PaccD-129 
<400> 23 

gtcgacatat tattttaaat aatataaagg gggttccaac atattaatat atagtgaagt 60 
gttccggatc c 71 
<210> 24 

<211> .27 

<212> DNA 

<213> Nicotiana tabacum 
<220> 

<221> promoter 
<222> (1)..<27) 

<223> plastidic promoter PclpP-53 
<400> 24 

agacaataaa aaaaattgtt acgtttc 27 

<210> 25 
<211> 65 
<212> DNA 

<213> Nicotiana tabacum 
<220> 

<221> promoter 
<222> (1) (65) 

<223> plastidic promoter Prrn-62 
<400> 25 

gagcgaactc cgggcgaata tgaagcgcat ggatacaagt tatgccttgg aatgaaagac 60 
aattc 65 
<210> 26 
<211> 107 
<212> DNA 

<213> Nicotiana tabacum 
<220> 

<221> promoter 
<222> (1) . - (107) 

<223> plastidic promoter Prpsl6 
<400> 26 

tctatatata tttatatatt aaatattaat taatatgtta gataaattaa tattagcgat 60 
ggggtcttac taaagaaaaa tatttatcca cctatctcta tagtata 107 

<210> 27 
<211> 47 
<212> DNA 

<213> Nicotiana tabacum 
<220> 

<221> promoter 
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<222> (1)..{47) 

<223> plastidic promoter PatpB/E-290 
<400> 27 

agaaatagaa aataaagttc aggttcgaat tccatagaat agataat 47 

<210> 28 
<211> 25 
<212> DNA 

<213> Nicotiana tabacum 



<220> 

<221> promoter 
<222> (1).. (25) 

<223> plastidic promoter PrpoB-345 
<400> 28 

aatgtgtatt atcataataa tggta 



25 



<210> 29 

<211> 35 - .... 

<212> DNA 

<213> Kttnstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Seguenz: promoter 

sequence derived from consensus sequence of 

E.coli sigma70 promoters 
<400> 29 

ttgacattca ctcttcaatt atctataatg ataca 35 

<210> 30 
<211> 80 
<212> DNA 

<213> Nicotiana tabacum 
<220> 

<221> misc_feature 
<222> (1)..{80) 

<223> 5 ' -untranslated region of psbA gene 
<400> 30 

tccattttct attttgattt gtagaaaact agtgtgcttg ggagtccctg atgattaaat 60 
aaaccaagat tttaccatgg 80 

<210> 31 
<211> 40 
<212> DNA 

<213> Nicotiana tabacum 
<220> 

<221> misc_feature 
<222> (1)..<40) 

<223> 5 ' -untranslated region and part of translated 

region of rbcL gene 
<400> 31 

agttgtaggg agggattcat gacaccacaa acagccatgg 40 
<210> 32 
<211> 22 
<212> DNA 

<213> Nicotiana tabacum 
<220> 

<221> misc_feature 
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<222> (1)..(22) 

<223> 5 ' -untranslated region of rbcL gene 



<400> 32 

agttgtaggg agggattcat ga 



22 



<210> 33 
<211> 127 
<212> DNA 

<213> synechocystis sp. 
<220> 

<221> misc_feature 
<222> {1} . . (127) 

<223> 3 '-untranslated region of Synechcystis psbA-1 gene 
<400> 33 

tgccattgcc ataactgctt tcggttagac ttcgtttcat ttggttaatc aagggcactc 60 
tcgcaatggg gtgcctttta tggtccaagg ttaaagttaa gccagtacta tttctagggt 120 
.gaaatgt 127 
<210> 34 
<211> 90 
<212> DNA 

<213> Nicotiana tabacum 
<220> 

<221> misc_feature 
<222> (1)..(90) 

<223> 3 ' -untranslated region of tobacco psbA gene 
<400> 34 

cctggcctag tctataggag gttttgaaaa gaaaggagca ataatcattt tcttgttcta 60 
tcaagagggt gctattgctc ctttcttttt 90 
<210> 35 
<211> 136 
<212> DNA 

<213> Nicotiana tabacum 
<220> 

<221> misc_feature 
<222> (1)..(136) 

<223> 3 ' -untranslated region of tobacco rbcL gene 
<400> 35 

agtagacatt agcagataaa ttagcaggaa ataaagaagg ataaggagaa agaactcaag 60 
taattatcct tcgttctctt aattgaattg caattaaact cggcccaatc ttttactaaa 120 
aggattgagc cgaata 136 
<210> 36 
<211> 13 
<212> DNA 

<213> Kiinstliche Sequenz 
<220> 

<223> Beschreibung der kiinstlichen Sequenz: synthetic 
ribosome binding site (RBS) 



<400> 36 
ggaggnnnnn atg 



13 



<210> 37 
<211> 13 
<212> DNA 



<213> Kiinstliche Sequenz 



PCT/EP02/14303 



<220> 

<223> Beschreibung der kunstlichen Sequenz: synthetic 
ribosome binding site (RBS) 

<400> 37 
ggaggatctc atg 

<210> 38 
<211> 34 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kiinstlichen Sequenz: 
oligonucleotide primer 

<400> 38 

atggatccat atggccatgg cacaaggggt tgtg 

<210> 39 
<211> 33 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kiinstlichen Sequenz: 
oligonucleotide primer 



<400> 39 

cccgggctcg agctgcagct acgccgctac gtc 

<210> 40 
<211> 2815 
<212> DNA 

<213> Kunstliche Sequenz 

<220> 
<223> 



<220> 
<221> CDS 

<222> (749) . . (2587) 

<223> ORF for Phi-C31 recombinase 



33 



Beschreibung der kunstlichen Sequenz: insert of 
binary vector pCB193-17 



<220> 
<221> CDS 

<222> (563) . . (2587) 

<223> ORF for fusion protein of Phi-C31 recombinase and 
plastidic transit peptide 

<400> 40 

gaattccatg gagtcaaaga ttcaaataga ggacctaaca gaactcgccg taaagactgg 60 
cgaacagttc atacagagtc tcttacgact caatgacaag aagaaaatct tcgtcaacat 120 
ggtggagcac gacacgcttg tctactccaa aaatatcaaa gatacagtct cagaagacca 180 
aagggcaatt gagacttttc aacaaagggt aatatccgga aacctcctcg gattccattg 240 
cccagctatc tgtcacttta ttgtgaagat agtggaaaag gaaggtggct cctacaaatg 300 
ccatcattgc gataaaagaa aggccatcgt tgaagatgcc tctgccgaca gtggtcccaa 360 
agatggaccc ccacccacga ggagcatcgt ggaaaaagaa gacgttccaa ccacgtcttc 420 
aaagcaagtg gattgatgtg atatctccac tgacgtaagg gatgacgcac aatcccacta 480 
tccttcgcaa gacccttcct ctatataagg aagttcattt catttggaga ggacagggta 540 
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cccgatatcc acaaccaaca cc atg tct get tct tct tta ttt aat etc cca 
Met Ser Ala Ser Ser Leu Phe Asn Leu Pro 
15 10 
ttg att cgc etc aga tct etc get ctt teg tct tct ttt tct tct ttc 
Leu lie Arg Leu Arg Ser Leu Ala Leu Ser Ser Ser Phe Ser Ser Phe 
*~ 15 20 25 

cga ttt gec cat cgt cct ctg tea teg att tea ccg aga aag tta ccg 
Arg Phe Ala His Arg Pro Leu Ser Ser He Ser Pro Arg Lys Leu Pro 

30 35 40 

aat ttt cgt get ttc tct ggt ace get atg aca gat act aaa gat ggg 
Asn Phe Arg Ala Phe Ser Gly Thr Ala Met Thr Asp Thr Lys Asp Gly 

45 50 55 

ate cat atg gec atg gca caa ggg gtt gtg acc ggg gtg gac acg tac 
He His Met Ala Met Ala Gin Gly Val Val Thr Gly Val Asp Thr Tyr 

60 65 70 

gcg ggt get tac gac cgt-cag teg cgc gag cgc gag aat- teg age gca 
Ala Gly Ala Tyr Asp Arg Gin Ser Arg Glu Arg Glu Asn Ser Ser Ala 
75 80 85 90 

gca age cca gcg aca cag cgt age gee aac gaa gac aag gcg gee gac 
Ala Ser Pro Ala Thr Gin Arg Ser Ala Asn Glu Asp Lys Ala Ala Asp 

95 100 105 

ctt cag cgc gaa gtc gag cgc gac ggg ggc egg ttc agg ttc gtc ggg 
Leu Gin Arg Glu Val Glu Arg Asp Gly Gly Arg Phe Arg Phe Val Gly 

HO 115 120 

cat ttc age gaa gcg ccg ggc acg teg gcg ttc ggg acg gcg gag cgc 
His Phe Ser Glu Ala Pro Gly Thr Ser Ala Phe Gly Thr Ala Glu Arg 

125 130 135 

ecg gag ttc gaa cgc ate ctg aac gaa tgc cgc gee ggg egg etc aac 
Pro Glu Phe Glu Arg He Leu Asn Glu Cys Arg Ala Gly Arg Leu Asn 

140 145 150 

atg ate att gtc tat gac gtg teg cgc ttc teg cgc ctg aag gtc atg 
Met He He Val Tyr Asp Val Ser Arg Phe Ser Arg Leu Lys Val Met 
155 160 165 170 

gac gcg att ccg att gtc teg gaa ttg etc gec ctg ggc gtg acg att 
Asp Ala He Pro He Val Ser Glu Leu Leu Ala Leu Gly Val Thr He 

175 180 185 

gtt tec act cag gaa ggc gtc ttc egg cag gga aac gtc atg gac ctg 
Val Ser Thr Gin Glu Gly Val Phe Arg Gin Gly Asn Val Met Asp Leu 

190 195 200 

att cac ctg att atg egg etc gac gcg teg cac aaa gaa tct teg ctg 
He His Leu He Met Arg Leu Asp Ala Ser His Lys Glu Ser Ser Leu 

205 210 215 

aag teg gcg aag att etc gac acg aag aac ctt cag cgc gaa ttg ggc 
Lys Ser Ala Lys He Leu Asp Thr Lys Asn Leu Gin Arg Glu Leu Gly 

220 225 230 

ggg tac gtc ggc ggg aag gcg cct tac ggc ttc gag ctt gtt teg gag 
Gly Tyr Val Gly Gly Lys Ala Pro Tyr Gly Phe Glu Leu Val Ser Glu 
235 240 245 250 

acg aag gag ate acg cgc aac ggc cga atg gtc aat gtc gtc ate aac 
Thr Lys Glu He Thr Arg Asn Gly Arg Met Val Asn Val Val He Asn 
255 260 265 



592 
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aag ctt gcg cac teg acc act ccc ctt acc gga ccc ttc gag ttc gag 
Lys Leu Ala His Ser Thr Thr Pro Leu Thr Gly Pro Phe Glu Phe Glu 

270 275 280 

ccc gac gta ate egg tgg tgg tgg cgt gag ate aag acg cac aaa cac 
Pro Asp Val He Arg Trp Trp Trp Arg Glu He Lys Thr His Lys His 

285 290 295 

ctt ccc ttc aag ccg ggc agt caa gee gec att cac ccg ggc age ate 
Leu Pro Phe Lys Pro Gly Ser Gin Ala Ala He His Pro Gly Ser He 

300 305 310 

acg ggg ctt tgt aag cgc atg gac get gac gee gtg ccg acc egg ggc 
Thr Gly Leu Cys Lys Arg Met Asp Ala Asp Ala Val Pro Thr Arg Gly 
315 320 325 330 

gag acg att ggg aag aag acc get tea age gee tgg gac ccg gca acc 
Glu Thr He Gly Lys Lys Thr Ala Ser Ser Ala Trp Asp Pro Ala Thr 
335 340 345 

• gtt atg cga ate ctt egg gac- ccg cgt att gcg ggc ttc- gec -get gag. 
Val Met Arg He Leu Arg Asp Pro Arg He Ala Gly Phe Ala Ala Glu 

350 355 360 

gtg ate tac aag aag aag ccg gac ggc acg ccg acc acg aag att gag 
Val He Tyr Lys Lys Lys Pro Asp Gly Thr Pro Thr Thr Lys He Glu 

365 370 375 

ggt tac cgc att cag cgc gac ccg ate acg etc egg ccg gtc gag ctt 
Gly Tyr Arg He Gin Arg Asp Pro He Thr Leu Arg Pro Val Glu Leu 

380 385 390 

gat tgc gga ccg ate ate gag ccc get gag tgg tat gag ctt cag gcg 
Asp Cys Gly Pro He He Glu Pro Ala Glu Trp Tyr Glu Leu Gin Ala 
395 400 405 410 

tgg ttg gac ggc agg ggg cgc ggc aag ggg ctt tec egg ggg caa gec 
Trp Leu Asp Gly Arg Gly Arg Gly Lys Gly Leu Ser Arg Gly Gin Ala 

415 420 425 

att ctg tec gec atg gac aag ctg tac tgc gag tgt ggc gec gtc atg 
lie Leu Ser Ala Met Asp Lys Leu Tyr Cys Glu Cys Gly Ala Val Met 

430 435 440 

act teg aag cgc ggg gaa gaa teg ate aag gac tct tac cgc tgc cgt 
Thr Ser Lys Arg Gly Glu Glu Ser He Lys Asp Ser Tyr Arg Cys Arg 

445 450 455 

cgc egg aag gtg gtc gac ccg tec gca cct ggg cag cac gaa ggc acg 
Arg Arg Lys Val Val Asp Pro Ser Ala Pro Gly Gin His Glu Gly Thr 

460 465 470 

tgc aac gtc age atg gcg gca etc gac aag ttc gtt gcg gaa cgc ate 
Cys Asn Val Ser Met Ala Ala Leu Asp Lys Phe Val Ala Glu Arg He 
475 480 485 490 

ttc aac aag ate agg cac gec gaa ggc gac gaa gag acg ttg gcg ctt 
Phe Asn Lys He Arg His Ala Glu Gly Asp Glu Glu Thr Leu Ala Leu 

495 500 505 

ctg tgg gaa gec gee cga cgc ttc ggc aag etc act gag gcg cct gag 
Leu Trp Glu Ala Ala Arg Arg Phe Gly Lys Leu Thr Glu Ala Pro Glu 

510 515 520 

aag age ggc gaa egg gcg aac ctt gtt gcg gag cgc gec gac gec ctg 
Lys Ser Gly Glu Arg Ala Asn Leu Val Ala Glu Arg Ala Asp Ala Leu 
525 530 535 
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aac gcc ctt gaa gag ctg tac gaa gac cgc gcg gca ggc gcg tac gac 2224 

Asn Ala Leu Glu Glu Leu Tyr Glu Asp Arg Ala Ala Gly Ala Tyr Asp 

540 545 550 

gga ccc gtt ggc agg aag cac ttc egg aag caa cag gca gcg ctg acg 2272 

Gly Pro Val Gly Arg Lys His Phe Arg Lys Gin Gin Ala Ala Leu Thr 
555 560 565 570 

etc egg cag caa ggg gcg gaa gag egg ctt gcc gaa ctt gaa gcc gcc 2320 
Leu Arg Gin Gin Gly Ala Glu Glu Arg Leu Ala Glu Leu Glu Ala Ala 

575 580 585 

gaa gcc ccg aag ctt ccc ctt gac caa tgg ttc ccc gaa gac gcc gac 2368 
Glu Ala Pro Lys Leu Pro Leu Asp Gin Trp Phe Pro Glu Asp Ala Asp 

590 595 600 

get gac ccg ace ggc cct aag teg tgg tgg ggg cgc gcg tea gta gac 2416 
Ala Asp Pro Thr Gly Pro Lys Ser Trp Trp Gly Arg Ala Ser Val Asp 

605 610 615 

gac aag cgc gtg' ttc gtc ggg~c'tc ttc gta gac aag'atc gtt gtc acg 2464 
Asp Lys Arg Val Phe Val Gly Leu Phe Val Asp Lys lie Val Val Thr 

620 625 630 

aag teg act acg ggc agg ggg cag gga acg ccc ate gag aag cgc get 2512 
Lys Ser Thr Thr Gly Arg Gly Gin Gly Thr Pro lie Glu Lys Arg Ala 
635 640 645 650 

teg ate acg tgg gcg aag ccg ccg acc gac gac gac gaa gac gac gcc 2560 
Ser lie Thr Trp Ala Lys Pro Pro Thr Asp Asp Asp Glu Asp Asp Ala 

655 660 665 

cag gac ggc acg gaa gac gta gcg gcg tagctgeage tcgacctgca 2607 
Gin Asp Gly Thr Glu Asp Val Ala Ala 
670 675 
ggcatgccct gctttaatga gatatgegag aegectatga tegcatgata tttgetttea 2667 
attctgttgc gcacgttgta aaaaacctga gcatgtgtag ctcagatcct taccgccggt 2727 
ttcggttcat tctaatgaat atatcacccg ttactatcgt atttttatga ataatattct 2787 
ccgttcaatt tactgattgt ccaagctt 2815 

<210> 41 
<211> 675 
<212> PRT 

<213> Kunstliche Sequenz 

<223> Beschreibung der kunstlichen Sequenz: insert of 
binary vector pCB193-17 



<400> 41 



Met 


Ser 


Ala 


Ser Ser 


Leu 


Phe 


Asn 


Leu 


Pro 


Leu 


He 


Arg 


Leu Arg Ser 


1 






5 










10 








15 


Leu 


Ala 


Leu 


Ser Ser 
20 


Ser 


Phe 


Ser 


Ser 
25 


Phe 


Arg 


Phe 


Ala 


His Arg Pro 
30 


Leu 


Ser 


Ser 
35 


lie Ser 


Pro 


Arg 


Lys 
40 


Leu 


Pro 


Asn 


Phe 


Arg 
45 


Ala Phe Ser 


Gly 


Thr 


Ala 


Met Thr 


Asp 


Thr 


Lys 


Asp 


Gly 


He 


His 


Met 


Ala Met Ala 


50 








55 










60 






Gin 


Gly 


Val 


Val Thr 


Gly 


Val 


Asp 


Thr 


Tyr 


Ala 


Gly 


Ala 


Tyr Asp Arg 


65 






70 










75 






80 


Gin 


Ser 


Arg 


Glu Arg 
85 


Glu 


Asn 


Ser 


Ser 


Ala 
90 


Ala 


Ser 


Pro 


Ala- Thr Gin 
95 


Arg 


Ser 


Ala 


Asn Glu 


Asp 


Lys 


Ala 


Ala 


Asp 


Leu 


Gin 


Arg 


Glu Val Glu 
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100 



Arg 


Asp 


Gly 


Gly Arg Phe Arg Phe 




115 


120 


Gly 


Thr 


Ser 


Ala Phe Gly Thr Ala 


130 




135 


Leu 


Asn 


Glu 


Cys Arg Ala Gly Arg 


145 






150 


Val 


Ser 


Arg 


Phe Ser Arg Leu Lys 








165 


Ser 
er 


Glu 


Leu 


Leu Ala Leu Gly Val 








180 


Val 


Phe 


Arg 


Gin Gly Asn Val Met 






195 


200 


Leu 


Asp 


Ala 


Ser His Lys Glu Ser 




210 




215 


Asp 


Thr 


Lys 


Asn Leu Gin Arg Glu 


225 






230 


Ala 


Pro 


Tyr 


Gly Phe Glu Leu Val 








245 


Asn 


Gly 


Arg 


Met Val Asn Val Val 








260 


Thr 


Pro 


Leu 


Thr Gly Pro Phe Glu 






275 


280 


_ 


Trp 


Arg 


Glu He Lys Thr His 


290 




295 


Ser 


Gin 


Ala 


Ala He His Pro Gly 


305 






310 


Met 


Asp 


Ala 


Asp Ala Val Pro Thr 








325 


Thr 


Ala 


Ser 


Ser Ala Trp Asp Pro 








340 


Asp 


Pro 


Arg 


lie Ala Gly Phe Ala 






355 


360 




Asp 


Gly 


Thr Pro Thr Thr Lys 




370 




375 


Asp 


Pro 


lie 


Thr Leu Arg Pro Val 


385 






390 


Glu 


Pro 


Ala 


Glu Trp Tyr Glu Leu 








405 


A 


Gly 


Lys 


Gly Leu Ser Arg Gly 








420 


Lys 


Leu 


Tyr 


Cys Glu Cys Gly Ala 




435 


440 


Glu 


Ser 


He 


Lys Asp Ser Tyr Arg 




450 




455 


Pro 


Ser 


Ala 


Pro Gly Gin His Glu 


465 






470 


Ala 


Leu 


Asp 


Lys Phe Val Ala Glu 








485 


Aia 


Glu 


Gly 


Asp Glu Glu Thr Leu 








500 


Arg 


Phe 


Gly 


Lys Leu Thr Glu Ala 




515 


520 


Asn 


Leu 


Val 


Ala Glu Arg Ala Asp 




530 




535 


Tyr 


Glu 


Asp 


Arg Ala Ala Gly Ala 


545 






550 



17 



105 


110 






Val Gly His 


Phe Ser Glu 


Ala 


Pro 




125 






Glu Arg Pro 


Glu Phe Glu 


Arg He 




140 






Leu Asn Met 


He He Val 


Tyr Asp 


155 






160 


Val Met Asp 


Ala He Pro 


He val 


170 




175 




Thr He Val 


Ser Thr Gin 


Glu Gly 


185 


190 






Asp Leu He 


His Leu He 


Met 


Arg 


205 






Ser Leu Lys 


Ser Ala Lys 


He 


Leu 




220 






Leu Gly Gly 


Tyr val Gly 


Gly Lys 


235 






240 


Ser Glu Thr 


Lys Glu He 


Thr 


Arg 


250 




255 




He Asn Lys 


Leu Ala His 


Ser 


Thr 


265 


270 






Phe Glu Pro 


Asp Val He 


Arg 


Trp 




285 






Lys His Leu 


Pro Phe Lys 


Pro 


Gly 




300 






Ser He Thr 


Gly Leu Cys 


Lys 


Arg 


315 






320 


Arg Gly Glu 


Thr He Gly 


Lys 


Lys 


330 




335 




Ala Thr Val 


Met Arg He 


Leu 


Arg 


345 


350 






Ala Glu Val 


He Tyr Lys 


Lys 


Lys 




365 






He Glu Gly 


Tyr Arg He 


Gin 


Arg 




380 






Glu Leu Asp 


Cys Gly Pro 


He 


He 


395 






400 


Gin Ala Trp 


Leu Asp Gly 


Arg 


Gly 


410 




415 




Gin Ala He 


Leu Ser Ala 


Met 


Asp 


425 


430 






val Met Thr 


Ser Lys Arg 


Gly 


Glu 




445 






Cys Arg Arg 


Arg Lys Val 


Val 


Asp 




460 






Gly Thr Cys 


Asn Val Ser 


Met 


Ala 


475 






480 


Arg He Phe 


Asn Lys He 


Arg 


His 


490 




495 




Ala Leu Leu 


Trp Glu Ala 


Ala 


Arg 


505 


510 






Pro Glu Lys 


Ser Gly Glu 


Arg 


Ala 




525 






Ala Leu Asn 


Ala Leu Glu 


Glu 


Leu 




540 






Tyr Asp Gly 


Pro val Gly 


Arg 


Lys 


555 






560 
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His 


Phe 


Arg 


Lys 


Gin 
565 


Gin Ala Ala 


Leu Thr Leu Arg 
570 


Gin Gin Gly Ala 
575 


Glu 


Glu 


Arg 


Leu 


Ala 


Glu Leu Glu 


Ala Ala Glu Ala 


Pro Lys Leu Pro 






580 






585 


590 


Leu 


Asp 


Gin 


Trp 


Phe 


Pro Glu Asp 


Ala Asp Ala Asp 


Pro Thr Gly Pro 




595 






600 




605 


Lys 


Ser 


Trp 


Trp 


Gly 


Arg Ala Ser 


Val Asp Asp Lys 


Arg Val Phe Val 


610 








615 


620 




Gly 


Leu 


Phe 


Val 


Asp 


Lys lie Val 


Val Thr Lys Ser 


Thr Thr Gly Arg 


625 










630 


635. 


640 


Gly 


Gin 


Gly 


Thr 


Pro 


lie Glu Lys 


Arg Ala Ser lie 


Thr Trp Ala Lys 








645 




650 


655 


Pro 


Pro 


Thr 


Asp 
660 


ASP 


Asp Glu Asp 


Asp Ala Gin Asp 
665 


Gly Thr Glu Asp 
670 


Val 


Ala 


Ala 
675 













■<210> 42 
<211> 613 
<212> PRT 

<213> Kunstliche Sequenz 

<223> Beschreibung der kunstlichen Sequenz : insert of 
binary vector pCB193-17 



<400> 42 



Met 


Ala 


Gin 


Gly 


Val 


Val 


Thr 


Gly 


Val 


Asp 


Thr Tyr 


Ala 


Gly Ala Tyr 


1 








5 










10 






15 


Asp 


Arg 


Gin 


Ser 


Arg 


Glu 


Arg 


Glu 


Asn 


Ser 


Ser Ala 


Ala 


Ser Pro Ala 






20 










25 








30 


Thr 


Gin 


Arg 
35 


Ser 


Ala 


Asn 


Glu 


Asp 
40 


Lys 


Ala 


Ala Asp 


Leu 
45 


Gin Arg Glu 


Val 


Glu 
50 


Arg 


Asp 


Gly 


Gly 


Arg 
55 


Phe 


Arg 


Phe 


Val Gly 
60 


His 


Phe Ser Glu 


Ala 


Pro 


Gly 


Thr 


Ser 


Ala 


Phe 


Gly 


Thr 


Ala 


Glu Arg 


Pro 


Glu Phe Glu 


65 










70 










75 




80 


Arg 


lie 


Leu 


Asn 


Glu 


Cys 


Arg 


Ala 


Gly 


Arg 


Leu Asn 


Met 


He He Val 








85 










90 






95 


Tyr 


Asp 


Val 


Ser 


Arg 


Phe 


Ser 


Arg 


Leu 


Lys 


Val Met 


Asp 


Ala He Pro 




100 










105 








110 


He 


Val 


Ser 
115 


Glu 


Leu 


Leu 


Ala 


Leu 
120 


Gly 


Val 


Thr He 


Val 
125 


Ser Thr Gin 


Glu 


Gly 
130 


Val 


Phe 


Arg 


Gin 


Gly 
135 


Asn 


Val 


Met 


Asp Leu 
140 


He 


His Leu He 


Met 


Arg 


Leu 


Asp 


Ala 


Ser 


His 


Lys 


Glu 


Ser 


Ser Leu 


Lys 


Ser Ala Lys 


145 








150 










155 




160 


He 


Leu 


Asp 


Thr 


Lys 


Asn 


Leu 


Gin 


Arg 


Glu 


Leu Gly 


Gly 


Tyr Val Gly 








165 










170 






175 


Gly 


Lys 


Ala 


Pro 


Tyr 


Gly 


Phe 


Glu 


Leu 


Val 


Ser Glu 


Thr 


Lys Glu He 




180 










185 








190 


Thr 


Arg 


Asn 
195 


Gly 


Arg 


Met 


Val 


Asn 
200 


Val 


Val 


He Asn 


Lys 
205 


Leu Ala His 


Ser 


Thr 
210 


Thr 


Pro 


Leu 


Thr 


Gly 
215 


Pro 


Phe 


Glu 


Phe Glu 
220 


Pro 


Asp Val He 


Arg 


Trp 


Trp 


Trp 


Arg 


Glu 


He 


Lys 


Thr 


His 


Lys His 


Leu 


Pro Phe Lys 


225 










230 










235 




240 


Pro 


Gly 


Ser 


Gin 


Ala 


Ala 


He 


His 


Pro 


Gly 


Ser He 


Thr 


Gly Leu Cys 








245 










250 






255 


Lys 


Arg 


Met 


Asp 


Ala 


Asp 


Ala 


Val 


Pro 


Thr 


Arg Gly 


Glu 


Thr He Gly 
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260 










265 








270 






Lys 


Lys 


Thr 


Ala 


Ser 


Ser 


Ala 


Trp 


Asp 


Pro 


Ala 


Thr Val 


Met 


Arg 


He 


275 










280 








285 








Leu 


Arg 


Asp 


Pro 


Arg 


He 


Ala 


Gly 


Phe 


Ala 


Ala 


Glu Val 


He 


Tyr 


Lys 


290 








295 










300 








L 


Lys 


Pro 


Asp 


Gly 


Thr 


Pro 


Thr 


Thr 


Lys 


He 


Glu Gly 


Tyr 


Arg 


He 


305 








310 










315 








320 


n 




ASP 


Pro 


lie 


Thr 


Leu 


Arg 


Pro 


Val 


Glu 


Leu Asp 


Cys 


Gly 


Pro 






325 










330 








335 




He 


lie 


Glu 


Pro 


Ala 


Glu 


Trp 


Tyr 


Glu 


Leu 


Gin 


Ala Trp 


Leu 


Asp 


Gly 




340 










345 








350 






Arg 


y 




Glv 


Lys 


Gly 


Leu 


Ser 


Arg 


Gly 


Gin 


Ala lie 


Leu 


Ser 


Ala 




355 










360 








365 








Met 






Leu 


Tvr 


Cys 


Glu 


Cys 


Gly 


Ala 


Val 


Met Thr 


Ser 


Lys 


Arg 




370 








375 










380 






Val 


Gly 


Glu 


Glu 


Ser 


He 


Lys 


Asp 


Ser 


Tyr 


Arg 


Cys 


Arg Arg 


Arg 


Lys 


385 










390 










395 








400 


Val 


Asp 


Pro 


Ser 


Al 


Pro 


Gly 


Gin 


His 


Glu 


Gly 


Thr Cys. 


Asn. 


Val 


Ser. 






405 










410 








415 




Met 


Ala 


Ala 




sp 




Phe 


Val 


Ala 


Glu 


Arg 


He Phe 


Asn 


Lys 


He 
















425 








430 






Arg 


His 


Ala 


Glu 


Gly 


Asp 


Glu 


Glu 


Thr 


Leu 


Ala 


Leu Leu 


Trp 


Glu 


Ala 














440 








445 








Ala 


450 


AT 


Phe 


Gly 


Lys 


Leu 
455 


Thr 


Glu 


Ala 


Pro 


Glu Lys 
460 


Ser 


Gly 


Glu 


Arg 


Ala 


Asn 


Leu 


val 


Ala 


Glu 


Arg 


Ala 


Asp 


Ala 


Leu Asn 


Ala 


Leu 


Glu 












470 










475 








480 


u 


eu 


Tyr 


Glu 


Asp 


Arg 


Ala 


Ala 


Gly 


Ala 


Tyr 


Asp Gly 


Pro 


val 


Gly 






485 










490 








495 




Arg 


Lys 


His 


Phe 


Arg 


Lys 


Gin 


Gin 


Ala 


Ala 


Leu 


Thr Leu 


Arg 


Gin 


Gin 




500 










505 








510 






Gly 


Ala 


Glu 


Glu 


Arg 


Leu 


Ala 


Glu 


Leu 


Glu 


Ala 


Ala Glu 


Ala 


Pro 


Lys 














520 








525 








U 


Pro 
530 


Leu 




Gin 


Trp 


Phe 
535 


Pro 


Glu 


Asp 


Ala 


Asp Ala 
540 


Asp 


Pro 


Thr 


Gly 


Pro 


Lys 


Ser 


Trp 


Trp 


Gly 


Arg 


Ala 


Ser 


Val 


Asp Asp 


Lys 


Arg 


val 


545 








550 










555 








560 


Phe 


Val 


Gly 


Leu 


Phe 


Val 


Asp 


Lys 


He 


Val 


Val 


Thr Lys 


Ser 


Thr 


Thr 








565 










570 








575 




Gly 


Arg 


Gly 


Gin 


Gly 


Thr 


Pro 


He 


Glu 


Lys 


Arg 


Ala Ser 


He 


Thr 


Trp 




580 










585 








590 






Ala 


Lys 


Pro 


Pro 


Thr 


Asp 


Asp 


Asp 


Glu 


Asp 


Asp 


Ala Gin 


Asp 


Gly 


Thr 




595 










600 








605 








Glu 


Asp 
610 


Val 


Ala 


Ala 























<210> 43 
<211> 31 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: 
oligonucleotide primer 



<400> 43 

tggatccata tggccatggc taagaaagta g 



31 
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<210> 44 
<211> 26 
<212> DNA 

<213> Kiinstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: 
oligonucleotide primer 

<400> 44 

cctcgagctg cagttaagcg agttgg 26 

<210> 45 
<211> 2430 
<212> DNA 

<213> Kttnstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: insert of 
binary vector pCB245-37 

<220> 
<221> CDS 

<222> (748) . . (2202) 

<223> ORF for TP901-1 recombinase 

<220> 
<221> CDS 

<222> (568) . . (2202) 

<223> ORF for fusionprotein of TP901-1 recombinase and 

plastidic transit peptide 
<400> 45 

tgaattccat gcatggagtc aaagattcaa atagaggacc taacagaact cgccgtaaag 60 
actggcgaac agttcataca gagtctctta cgactcaatg acaagaagaa aatcttcgtc 120 
aacatggtgg agcacgacac gcttgtctac tccaaaaata tcaaagatac agtctcagaa 180 
gaccaaaggg caattgagac ttttcaacaa agggtaatat ccggaaacct cctcggattc 240 
cattgcccag ctatctgtca ctttattgtg aagatagtgg aaaaggaagg tggctcctac 300 
aaatgccatc attgcgataa aagaaaggcc atcgttgaag atgcctctgc cgacagtggt 360 
cccaaagatg gacccccacc cacgaggagc atcgtggaaa aagaagacgt tccaaccacg 420 
tcttcaaagc aagtggattg atgtgatatc tccactgacg taagggatga cgcacaatcc 480 
cactatcctt cgcaagaccc ttcctctata taaggaagtt catttcattt ggagaggaca 540 
gggtacccga tatccacaac caacacc atg tct get tct tct tta ttt aat etc 594 
Met Ser Ala Ser Ser Leu Phe Asn Leu 
1 5 

cca ttg att cgc etc aga tct etc get ctt teg tct tct ttt tct tct 642 
Pro Leu lie Arg Leu Arg Ser Leu Ala Leu Ser Ser Ser Phe Ser Ser 
10 15 20 25 

ttc cga ttt gee cat cgt cct ctg tea teg att tea ccg aga aag tta 690 
Phe Arg Phe Ala His Arg Pro Leu Ser Ser He Ser Pro Arg Lys Leu 

30 35 40 

ccg aat ttt cgt get ttc tct ggt acc get atg aca gat act aaa gat 738 
Pro Asn Phe Arg Ala Phe Ser Gly Thr Ala Met Thr Asp Thr Lys Asp 

45 50 55 

ggg ate ccc atg get aag aaa gca gca ate tat aca cga gta tec act 786 
Gly He Pro Met Ala Lys Lys Ala Ala He Tyr Thr Arg Val Ser Thr 
60 65 .70 
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act aac caa gca gag gaa ggg ttc tea att gat gag caa att gac cgt 
Thr Asn Gin Ala Glu Glu Gly Phe Ser He Asp Glu Gin He Asp Arg 

75 80 85 

tta aca aaa tat get gaa gca atg ggg tgg caa gta tct gat act tat 
Leu Thr Lys Tyr Ala Glu Ala Met Gly Trp Gin Val Ser Asp Thr Tyr 
90 95 100 105 

act gat get ggt ttt tea ggg gee aaa ctt gaa cgc cca gca atg caa 
Thr Asp Ala Gly Phe Ser Gly Ala Lys Leu Glu Arg Pro Ala Met Gin 

110 115 120 

aga tta ate aac gat ate gag aat aaa get ttt gat aca gtt ctt gta 
Arg Leu He Asn Asp He Glu Asn Lys Ala Phe Asp Thr Val Leu Val 

125 130 135 

tat aag eta gac cgc ctt tea cgt agt gta aga gat act ctt tat ctt 
Tyr Lys Leu Asp Arg Leu Ser Arg Ser Val Arg Asp Thr Leu Tyr Leu 

140 145 150 

gtt aag gat gtg ttc aca aaa aat aaa ata gac ttt- ate- teg -ctt -aat - 
Val Lys Asp Val Phe Thr Lys Asn Lys He Asp Phe He Ser Leu Asn 

155 * 160 165 

gaa agt att gat act tct tct get atg ggt age ttg ttt etc act att 
Glu Ser He Asp Thr Ser Ser Ala Met Gly Ser Leu Phe Leu Thr He 
170 175 180 185 

ctt tct gca att aat gag ttt gaa aga gag aat ata aaa gaa cgc atg 
Leu Ser Ala He Asn Glu Phe Glu Arg Glu Asn He Lys Glu Arg Met 

190 195 200 

act atg ggt aaa eta ggg cga gcg aaa tct ggt aag tct atg atg tgg 
Thr Met Gly Lys Leu Gly Arg Ala Lys Ser Gly Lys Ser Met Met Trp 

205 210 215 

act aag aca get ttt ggg tat tac cac aac aga aag aca ggt ata tta 
Thr Lys Thr Ala Phe Gly Tyr Tyr His Asn Arg Lys Thr Gly He Leu 

220 225 230 

gaa att gtt cct tta caa get aca ata gtt gaa caa ata ttc act gat 
Glu He Val Pro Leu Gin Ala Thr He Val Glu Gin He Phe Thr Asp 

235 240 245 

tat tta tea gga ata tea ctt aca aaa tta aga gat aaa etc aat gaa 
Tyr Leu Ser Gly He Ser Leu Thr Lys Leu Arg Asp Lys Leu Asn Glu 
250 255 260 265 

tct ggg cac ate ggt aaa gat ata ccg tgg tct tat cgt acc eta aga 
Ser Gly His He Gly Lys Asp He Pro Trp Ser Tyr Arg Thr Leu Arg 

270 275 280 

caa aca ctt gat aat cca gtt tac tgt ggt tat ate aaa ttt aag gac 
Gin Thr Leu Asp Asn Pro Val Tyr Cys Gly Tyr He Lys Phe Lys Asp 

285 290 295 

age eta ttt gaa ggt atg cac aaa cca att ate cct tat gag act tat 
Ser Leu Phe Glu Gly Met His Lys Pro He He Pro Tyr Glu Thr Tyr 

300 305 310 

tta aaa gtt caa aaa gag eta gaa gaa aga caa cag cag act tat gaa 
Leu Lys Val Gin Lys Glu Leu Glu Glu Arg Gin Gin Gin Thr Tyr Glu 

315 320 325 

aga aat aac aac cct aga cct ttc caa get aaa tat atg ctg tea ggg 
Arg Asn Asn Asn Pro Arg Pro Phe Gin Ala Lys Tyr Met Leu Ser Gly 
330 335 340 345 
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atg gca agg tgc ggt tac tgt gga gca cct tta aaa att gtt ctt ggc 
Met Ala Arg Cys Gly Tyr Cys Gly Ala Pro Leu Lys He Val Leu Gly 

350 355 360 

cac aaa aga aaa gat gga age cgc act atg aaa tat cac tgt gca aat 
His Lys Arg Lys Asp Gly Ser Arg Thr Met Lys Tyr His Cys Ala Asn 

365 370 375 

aga ttt cct cga aaa aca aaa gga att aca gta tat aat gac aat aaa 
Arg Phe Pro Arg Lys Thr Lys Gly He Thr Val Tyr Asn Asp Asn Lys 

380 385 390 

aag tgt gat tea gga act tat gat tta agt aat tta gaa aat act gtt 
Lys Cys Asp Ser Gly Thr Tyr Asp Leu Ser Asn Leu Glu Asn Thr Val 

395 400 405 

att gac aac ctg att gga ttt caa gaa aat aat gac tec tta ttg aaa 
He Asp Asn Leu He Gly Phe Gin Glu Asn Asn Asp Ser Leu Leu Lys 
410 415 420 425 

att ate aat ggc- aac aac caa cct. att. ctt gat . act .teg t.ca ttt. aaa . 
He He Asn Gly Asn Asn Gin Pro He Leu Asp Thr Ser Ser Phe Lys 

430 435 440 

aag caa att tea cag ate gat aaa aaa ata caa aag aac tct gat ttg 
Lys Gin He Ser Gin He Asp Lys Lys He Gin Lys Asn Ser Asp Leu 

445 450 455 

tac eta aat gat ttt ate act atg gat gag ttg aaa gat cgt act gat 
Tyr Leu Asn Asp Phe He Thr Met Asp Glu Leu Lys Asp Arg Thr Asp 

460 * 465 470 

tec ctt cag get gag aaa aag ctg ctt aaa get aag att age gaa aat 
Ser Leu Gin Ala Glu Lys Lys Leu Leu Lys Ala Lys He Ser Glu Asn 

475 480 485 

aaa ttt aat gac tct act gat gtt ttt gag tta gtt aaa act cag ttg 
Lys Phe Asn Asp Ser Thr Asp Val Phe Glu Leu Val Lys Thr Gin Leu 
490 495 500 505 

ggc tea att ccg att aat gaa eta tea tat gat aat aaa aag aaa ate 
Gly Ser He Pro He Asn Glu Leu Ser Tyr Asp Asn Lys Lys Lys He 

510 515 520 

gtc aac aac ctt gta tea aag gtt gat gtt act get gat aat gta gat 2178 
Val Asn Asn Leu Val Ser Lys Val Asp Val Thr Ala Asp Asn Val Asp 

525 530 535 

ate ata ttt aaa ttc caa etc get taactgeage tcgacctgca 2222 
He He Phe Lys Phe Gin Leu Ala 

540 545 
ggcatgccct gctttaatga gatatgegag aegectatga tegcatgata tttgetttea 2282 
attctgttgc gcacgttgta aaaaacctga gcatgtgtag ctcagatcct taccgccggt 2342 
ttcggttcat tctaatgaat atatcacccg ttactatcgt atttttatga ataatattct 2402 
ccgttcaatt tactgattgt ccaagctt 2430 

<210> 46 
<211> 545 
<212> PRT 

<213> Kunstliche Sequenz 

<223> Beschreibung der kunstlichen Sequenz: insert of 

binary vector pCB245-37 
<400> 46 

Met Ser Ala Ser Ser Leu Phe Asn Leu Pro Leu He Arg Leu Arg Ser 



1986 



2034 



2082 



.2130 



WO 03/054201 



PCT/EP02/14303 



23 



1 




5 










10 




15 




Leu 


Ala 


Leu Ser Ser 


Ser 


Phe 


Ser 


Ser 


Phe 


Arg Phe Ala 


His Arg 


Pro 




20 








25 






30 




Leu 


Ser 


Ser He Ser 


Pro 


Arg Lys 


Leu 


Pro 


Asn Phe Arg 


Ala Phe 


Ser 




35 






40 






45 






Gly 


Thr 


Ala Met Thr 


Asp 


Thr 


Lys 


Asp 


Gly 


He Pro Met 


Ala Lys 


Lys 


50 






55 








60 






Ala 


Ala 


He Tyr Thr 


Arg 


Val 


Ser 


Thr 


Thr 


Asn Gin Ala 


Glu Glu Gly 


65 




70 










75 




80 


Phe 


Ser 


He Asp Glu 


Gin 


He Asp 


Arg 


Leu 


Thr Lys Tyr 


Ala Glu Ala 






85 










90 




95 




Met 


Gly 


Trp Gin Val 


Ser 


Asp Thr 


Tyr 


Thr 


Asp Ala Gly 


Phe Ser Gly 




100 








105 






110 




Ala 


Lys 


Leu Glu Arg 


Pro 


Ala Met 


Gin 


Arg 


Leu He Asn 


Asp He Glu 




115 






120 






125 






Asn 


Lys 


Ala Phe Asp 


Thr 


Val 




Val 


Tyr 


Lys Leu Asp 


Arg Leu 


Ser 




130 






135 








140 






Arg 


Ser' 


Val' Arg Asp' 


Thr 


Leu 


Tvr 


Leu 


Val 


Lys Asp Val 


Phe- Thr 


-Lys- 


145 






150 










155 




160 


Asn 


Lys 


He Asp Phe 


He 


Ser 


Leu 


Asn 


Glu 


Ser He Asp 


Thr Ser 


Ser 




165 










170 




175 




Ala 


Met 


Gly Ser Leu 


Phe 


Leu 


Thr 


He 


Leu 


Ser Ala He 


Asn Glu 


Phe 






180 








185 






190 




Glu 


Arg 


Glu Asn He 


Lys 


Glu 


Arg 


Met 


Thr 


Met Gly Lys 


Leu Gly 


Arg 




195 






200 






205 






Ala 


Lys 


Ser Gly Lys 


Ser 


Met 


Met 


Trp 


Thr 


Lys Thr Ala 


Phe Gly 


Tyr 




210 






215 








220 






Tyr 


His 


Asn Arg Lys 


Thr 


Gly 


He 


Leu 


Glu 


He Val Pro 


Leu Gin 


Ala 


225 






230 










235 




240 


Thr 


He 


Val Glu Gin 


lie 


Phe 


Thr 


Asp 


Tyr 


Leu Ser Gly 


He Ser 


Leu 






245 










250 




255 




Thr 


Lys 


Leu Arg Asp 


Lys 


Leu 


Asn 


Glu 


Ser 


Gly His He 


Gly Lys 


Asp 




260 








265 






270 




He 


Pro 


Trp Ser Tyr 


Arg 


Thr 


Leu 


Arg 


Gin 


Thr Leu Asp 


Asn Pro 


Val 






275 






280 






285 






Tyr 


Cys 


Gly Tyr He 


Lys 


Phe 


Lys 


Asp 


Ser 


Leu Phe Glu 


Gly Met 


His 




290 






295 








300 






Lys 


Pro 


He He Pro 


Tyr 


Glu 


Thr 


Tyr 


Leu 


Lys Val Gin 


Lys Glu 


Leu 


305 






310 










315 




320 


Glu 


Glu 


Arg Gin Gin 


Gin 


Thr 


Tyr 


Glu 


Arg 


Asn Asn Asn 


Pro Arg 


Pro 






325 










330 




335 




Phe 


Gin 


Ala Lys Tyr 


Met 


Leu 


Ser 


Gly 


Met 


Ala Arg Cys 


Gly Tyr 


Cys 






340 








345 






350 




Gly 


Ala 


Pro Leu Lys 


He 


Val 


Leu 


Gly 


His 


Lys Arg Lys 


Asp Gly 


Ser 




355 






360 






365 






Arg 


Thr 


Met Lys Tyr 


His 


Cys 


Ala 


Asn 


Arg 


Phe Pro Arg 


Lys Thr 


Lys 


370 






375 








380 






Gly 


He 


Thr Val Tyr 


Asn 


Asp 


Asn 


Lys 


Lys 


Cys Asp Ser 


Gly Thr 


Tyr 


385 






390 










395 




400 


Asp 


Leu 


Ser Asn Leu 


Glu 


Asn 


Thr 


Val 


He 


Asp Asn Leu 


He Gly 


Phe 




405 










410 




415 




Gin 


Glu 


Asn Asn Asp 


Ser 


Leu 


Leu 


Lys 


He 


He Asn Gly 


Asn Asn 


Gin 






420 








425 






430 




Pro 


He 


Leu Asp Thr 


Ser 


Ser 


Phe 


Lys 


Lys 


Gin He Ser 


Gin He 


Asp 






435 






440 






445 






Lys 


Lys 


He Gin Lys 


Asn 


Ser 


Asp 


Leu 


Tyr 


Leu Asn Asp 


Phe He 


Thr 


450 






455 








460 
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Met 


Asp Glu 


Leu Lys 


Asp Arg 


Thr Asp Ser 


Leu 


Gin Ala 


Glu 


Lys 


Lys 


465 




470 
















Leu 


Leu Lys 


Ala Lys 


lie Ser 


Glu Asn Lys 


Phe 


Asn 


Asp 


Ser 


Thr 


Asp 




485 




490 










495 




val 


Phe Glu 


Leu Val 


Lys Thr 


Gin Leu Gly 


Ser 


He 


Pro 


He 


Asn 


Glu 






500 




505 








510 






Leu 


Ser Tyr 


Asp Asn 


Lys Lys 


Lys lie Val 


Asn 


Asn 


Leu 


Val 


Ser 


Lys 




515 






520 






525 








val 


Asp Val 


Thr Ala Asp Asn 


Val Asp lie 


He 


Phe 


Lys 


Phe 


Gin 


Leu 




530 




535 






540 











Ala 
545 



<210> 47 
<211> 485 
<212> PRT 

<213> Kunstliche Sequenz 

<223> Beschreibung der kunstlichen Sequenz: insert of 
binary vector pCB245-37 



<400> 47 



Met 


Ala 


Lys 


Lys 


Ala 


Ala 


He 


Tyr 


Thr 




a 


er 


r 


r 




n 


1 






5 
























Ala 


Glu 


Glu 


Gly 


Phe 


Ser 


lie 


Asp 


u 










Leu 


Thr 


L 






20 


























Tyr 


Ala 


Glu 


Ala 


Met 


Gly 


Trp 




i 


Ser 


p 


r 




Thr 


AS 


Ala 




35 










40 










45 








Gly 


Phe 


Ser 


Gly 


Ala 


Lys 


Leu 


Glu 


Arg 


Pro 


Ala 


Met 


Gin 


Arg 


Leu 


He 


50 










55 




















Asn 




He 


Glu 


Asn 


Lys 


Ala 


Phe 


Asp 


Thr 


Val 


Leu 


Val 


Tyr 


Lys 


Leu 


65 








70 










75 










80 


Asp 


Arg 


Leu 


Ser 


Arg 


Ser 


Val 


Arg 


Asp 


Thr 


Leu 


Tyr 


Leu 


Val 


Lys 


Asp 






85 










90 










95 




Val 


Phe 


Thr 


Lys 

100 


Asn 


Lys 


He 


Asp 


Phe 
105 


He 


Ser 


Leu 


Asn 


Glu 
110 


Ser 


He 


Asp 


Thr 


Ser 


Ser 


Ala 


Met 


Gly 


Ser 


Leu 


Phe 


Leu 


Thr 


He 


Leu 


Ser 


Ala 




115 










120 










125 








He 


Asn 
130 


Glu 


Phe 


Glu 


Arg 


Glu 
135 


Asn 


He 


Lys 


Glu 


Arg 
140 


Met 


Thr 


Met 


Gly 


Lys 


Leu 


Gly 


Arg 


Ala 


Lys 


Ser 


Gly 


Lys 


Ser 


Met 


Met 


Trp 


Thr 


Lys 


Thr 


145 








150 










155 










160 


Ala 


Phe 


Gly 


Tyr 


Tyr 


His 


Asn 


Arg 


Lys 


Thr 


Gly 


He 


Leu 


Glu 


He 


Val 






165 










170 










175 




Pro 


Leu 


Gin 


Ala 
180 


Thr 


He 


Val 


Glu 


Gin 
185 


He 


Phe 


Thr 


Asp 


Tyr 

190 


Leu 


Ser 


Gly 


He 


Ser 


Leu 


Thr 


Lys 


Leu 


Arg 


Asp 


Lys 


Leu 


Asn 


Glu 


Ser 


Gly 


His 




195 










200 










205 








He 


Gly 


Lys 


Asp 


He 


Pro 


Trp 


Ser 


Tyr 


Arg 


Thr 


Leu 


Arg 


Gin 


Thr 


Leu 




210 








215 










220 










ASp 


Asn 


Pro 


Val 


Tyr 


Cys 


Gly 


Tyr 


He 


Lys 


Phe 


Lys 


Asp 


Ser 


Leu 


Phe 


225 










230 










235 










240 


Glu 


Gly 


Met 


His 


Lys 


Pro 


He 


He 


Pro 


Tyr 


Glu 


Thr 


Tyr 


Leu 


Lys 


Val 








245 










250 










255 




Gin 


Lys 


Glu 


Leu 


Glu 


Glu 


Arg 


Gin 


Gin 


Gin 


Thr 


Tyr 


Glu 


Arg 


Asn 


Asn 






260 










265 










270 






Asn 


Pro 


Arg 
275 


Pro 


Phe 


Gin 


Ala 


Lys 
280 


Tyr 


Met 


Leu 


Ser 


Gly 
285 


Met 


Ala 


Arg 


Cys 


Gly 


Tyr 


Cys 


Gly 


Ala 


Pro 


Leu 


Lys 


He 


Val 


Leu 


Gly 


His 


Lys 


Arg 



i 
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290 






295 




300 








Lys 


Asp 


Gly 


Ser Arg 


Thr Met 


Lys Tyr His Cys 


Ala 


Asn 


Arg 


Phe Pro 


305 






310 


315 








320 


Arg 


Lys 


Thr 


Lys Gly 


He Thr 


Val Tyr Asn Asp 


Asn 


Lys 


Lys 


Cys Asp 




325 




330 








335 


Ser 


Gly 


Thr 


Tyr Asp 


Leu Ser 


Asn Leu Glu Asn 


Thr 


Val 




Asp Asn 






340 




345 










Leu 


lie 


Gly 

355 


Phe Gin 


Glu Asn 


Asn Asp Ser Leu 
360 


Leu 


Lys 
365 


He 


He Asn 


Gly 


Asn 


Asn 


Gin Pro 


He Leu 


Asp Thr Ser Ser 


Phe 


Lys 




Gl 11 


370 






375 




380 








Ser 


Gin 


He 


Asp Lys 


Lys He 


Gin Lys Asn Ser 


Asp 


Leu 


Tyr 


Leu Asn 


385 








390 


395 








400 


Asp 


Phe 


He 


Thr Met 


Asp Glu 


Leu Lys Asp Arg 


Thr 


Asp 


Ser 


Leu Gin 






405 




410 








415 


Ala 


Glu 


Lys 


Lys Leu 


Leu Lys 


Ala Lys He Ser 


Glu 


Asn 


Lys 


Phe Asn 






420 




425 






430 




Asp 


Ser 


Thr 


Asp Val 


Phe Glu 


Leu - Val Lys Thr 




Leu -Gly ..Ser -He - 




435 






440 




445 






Pro 


lie 
450 


Asn 


Glu Leu 


Ser Tyr 
455 


Asp Asn Lys Lys 


Lys 
460 


He 


Val 


Asn Asn 


Leu 


Val 


Ser 


Lys Val 


Asp Val 


Thr Ala Asp Asn 


Val 


Asp 


He 


He Phe 


465 






470 


475 








480 


Lys 


Phe 


Gin 


Leu Ala 
485 















<210> 48 
<211> 2077 
<212> DNA 

<213> Ktinstliche Seguenz 
<220> 

<223> Beschreibung der kiinstlichen Seguenz: insert of 

vector pCB249-24 
<400> 48 

ggtacgtcga cgaagttcct attccgaagt tcctattctc aagaaagtat aggaacttcg 60 
taccgtcgag aaaaaaagaa aggagcaata gcaccctctt gatagaacaa gaaaatgatt 120 
attgctcctt tcttttcaaa acctcctata gactaggcca ggaattatct gcagttattt 180 
gccaactacc ttagtgatct cgcctttcac gtagtggaca aattcttcca actgatctgc 240 
gcgcgaggcc aagcgatctt cttcttgtcc aagataagcc tgtctagctt caagtatgac 300 
gggctgatac tgggccggca ggcgctccat tgcccagtcg gcagcgacat ccttcggcgc 360 
gattttgccg gttactgcgc tgtaccaaat gcgggacaac gtaagcacta catttcgctc 420 
atcgccagcc cagtcgggcg gcgagttcca tagcgttaag gtttcattta gcgcctcaaa 480 
tagatcctgt tcaggaaccg gatcaaagag ttcctccgcc gctggaccta ccaaggcaac 540 
gctatgttct cttgcttttg tcagcaagat agccagatca atgtcgatcg tggctggctc 600 
gaagatacct gcaagaatgt cattgcgctg ccattctcca aattgcagtt cgcgcttagc 660 
tggataacgc cacggaatga tgtcgtcgtg cacaacaatg gtgacttcta cagcgcggag 720 
aatctcgctc tctccagggg aagccgaagt ttccaaaagg tcgttgatcc gtacctccaa 780 
ctcgcttaat tgcgagtttt tatttcgttt atttcaatta aggtaactaa aaaactcctt 840 
ttaaggagtt tctgagatcc gtagtgcccc aactggggta acctttgagt tctctcagtt 900 
gggggcgtag aattagatct cgactctata tatatttata tattaaatat taattaatat 960 
gttagataaa ttaatattag cgatggggtc ttactaaaga aaaatattta tccacctatc 1020 
tctatagtat ataggatcta gttgtaggga gggattcatg acaccacaaa cagccatggg 1080 
agcttggatt gaacaagatg gattgcacgc aggttctccg gccgcttggg tggagaggct 1140 
attcggctat gactgggcac aacagacaat cggctgctct gatgccgccg tgttccggct 1200 
gtcagcgcag gggcgcccgg ttctttttgt caagaccgac ctgtccggtg ccctgaatga 1260 
actgcaggac gaggcagcgc ggctatcgtg gctggccacg acgggcgttc cttgcgcagc 1320 
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tgtgctcgac gttgtcactg aagcgggaag ggactggctg ctattgggcg aagtgccggg 1380 
gcaggatctc ctgtcatctc accttgctcc tgccgagaaa gtatccatca tggctgatgc 1440 
aatgcggcgg ctgcatacgc ttgatccggc tacctgccca ttcgaccacc aagcgaaaca 1500 
tcgcatcgag cgagcacgta ctcggatgga agccggtctt gtcgatcagg atgatctgga 1560 
cgaagagcat caggggctcg cgccagccga actgttcgcc aggctcaagg cgcgcatgcc 1620 
cgacggcgag gatctcgtcg tgacccatgg cgatgcctgc ttgccgaata tcatggtgga 1680 
aaatggccgc ttttctggat tcatcgactg tggccggctg ggtgtggcgg accgctatca 1740 
ggacatagcg ttggctaccc gtgatattgc tgaagagctt ggcggcgaat gggctgaccg 1800 
cttcctcgtg ctttacggta tcgccgctcc cgattcgcag cgcatcgcct tctatcgcct 1860 
tcttgacgag ttcttctgag cgggacccaa gctagcttcg acggatcaaa gaattcagta 1920 
gacattagca gataaattag caggaaataa agaaggataa ggagaaagaa ctcaagtaat 1980 
tatccttcgt tctcttaatt gaattgcaat taaactcggc ccaatctttt actaaaagga 2040 
ttgagccgaa tactcgagag gggtacgtac cgagctc 2077 

<210> 49 
<211> 2662 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kiinstlichen Sequenz: insert of 
vector pCB384-40 

<400> 49 

ggtacgtcga cgaagttcct attccgaagt tcctattctc aagaaagtat aggaacttcg 60 
taccgtcgag aaaaaaagaa aggagcaata gcaccctctt gatagaacaa gaaaatgatt 120 
attgctcctt tcttttcaaa acctcctata gactaggcca ggaattatct gcagttattt 180 
gccaactacc ttagtgatct cgcctttcac gtagtggaca aattcttcca actgatctgc 240 
gcgcgaggcc aagcgatctt cttcttgtcc aagataagcc tgtctagctt caagtatgac 300 
gggctgatac tgggccggca ggcgctccat tgcccagtcg gcagcgacat ccttcggcgc 360 
gattttgccg gttactgcgc tgtaccaaat gcgggacaac gtaagcacta catttcgctc 420 
atcgccagcc cagtcgggcg gcgagttcca tagcgttaag gtttcattta gcgcctcaaa 480 
tagatcctgt tcaggaaccg gatcaaagag ttcctccgcc gctggaccta ccaaggcaac 540 
gctatgttct cttgcttttg tcagcaagat agccagatca atgtcgatcg tggctggctc 600 
gaagatacct gcaagaatgt cattgcgctg ccattctcca aattgcagtt cgcgcttagc 660 
tggataacgc cacggaatga tgtcgtcgtg cacaacaatg gtgacttcta cagcgcggag 720 
aatctcgctc tctccagggg aagccgaagt ttccaaaagg tcgttgatcc gtacctccaa 780 
ctcgcttaat tgcgagtttt tatttcgttt atttcaatta aggtaactaa aaaactcctt 840 
ttaaggagtt tctgagatcc gtagtgcccc aactggggta acctttgagt tctctcagtt 900 
gggggcgtag aattagatct cgactctata tatatttata tattaaatat taattaatat 960 
gttagataaa ttaatattag cgatggggtc ttactaaaga aaaatattta tccacctatc 1020 
tctatagtat ataggatcta gttgtaggga gggattcatg acaccacaaa cagccatggg 1080 
agcttggatt gaacaagatg gattgcacgc aggttctccg gccgcttggg tggagaggct 1140 
attcggctat gactgggcac aacagacaat cggctgctct gatgccgccg tgttccggct 1200 
gtcagcgcag gggcgcccgg ttctttttgt caagaccgac ctgtccggtg ccctgaatga 1260 
actgcaggac gaggcagcgc ggctatcgtg gctggccacg acgggcgttc cttgcgcagc 1320 
tgtgctcgac gttgtcactg aagcgggaag ggactggctg ctattgggcg aagtgccggg 1380 
gcaggatctc ctgtcatctc accttgctcc tgccgagaaa gtatccatca tggctgatgc 1440 
aatgcggcgg ctgcatacgc ttgatccggc tacctgccca ttcgaccacc aagcgaaaca 1500 
tcgcatcgag cgagcacgta ctcggatgga agccggtctt gtcgatcagg atgatctgga 1560 
cgaagagcat caggggctcg cgccagccga actgttcgcc aggctcaagg cgcgcatgcc 1620 
cgacggcgag gatctcgtcg tgacccatgg cgatgcctgc ttgccgaata tcatggtgga 1680 
aaatggccgc ttttctggat tcatcgactg tggccggctg ggtgtggcgg accgctatca 1740 
ggacatagcg ttggctaccc gtgatattgc tgaagagctt ggcggcgaat gggctgaccg 1800 
cttcctcgtg ctttacggta tcgccgctcc cgattcgcag cgcatcgcct tctatcgcct 1860 
tcttgacgag ttcttctgag cgggacggat cctgatcttc cattttctat tttgatttgt 1920 
agaaaactag tgtgcttggg agtccctgat gattaaataa accaagattt taccatggcg 1980 
ctcaccaatg ctcaaatctt ggctgtgatt gacagttggg aagaaacagt cggtcagttt 2040 
ccagtgataa cgcaccatgt accattaggt ggcggtctgc aaggaacgct ccattgttac 2100 
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gagatccccc tagcagctcc ttatggggtt ggctttgcta agaatgggcc tacccgctgg 2160 
caatacaaac ggacaatcaa tcaagtcgtc cacagatggg ggtcccacac agtccctttt 2220 
ctattagaac cggataacat caacggcaaa acctgcacag catcgcacct atgtcataat 2280 
actcgatgcc acaatccctt gcacttgtgc tgggagtcac tagacgacaa caaaggcaga 2340 
aactggtgcc ccggtcccaa cgggggatgt gtccatgcgg tggtttgttt aaggcagggt 2400 
ccgttgtacg gcccaggggc gactgtggca ggtcctcaac aaaggggcag tcactttgtg 2460 
gtataactgc agaagcttca attgcatgct ctagagaatt cagtagacat tagcagataa 2520 
attagcagga aataaagaag gataaggaga aagaactcaa gtaattatcc ttcgttctct 2580 
taattgaatt gcaattaaac tcggcccaat cttttactaa aaggattgag ccgaatactc 2640 
gagaggggta cgtaccgagc tc 2562 

<210> 50 
<211> 1287 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kftnst lichen Seguenz: insertion of 
vector pCB456-2 

<400> 50 

gagctctcag tactcgagac atttcaccct agaaatagac ttaaacttta ctggcttaac 60 
tttaaccttg gaccataaaa ggcaccccat tgcgagagtg cccttgatta accaaatgaa 120 
acgaagtcta accgaaagca gttatggcaa tggcagaatt ctgatcacgg aagatagctt 180 
tggcaaaaaa agcaaaaagc atttaccttg attgagatgt taattgtgtt ggcaattatc 240 
agtattttaa ttttgctttt tgtgccaaat ttgatactag agcttcgggt gccagggcgt 300 
gcccttgggc tccccgggcg cgtactcgac gctaccttaa gagagtcaag ctaattctaa 360 
tctgcagtct agcgtgcggc cgctctagaa ctagtggatc ccccgggctg cagttatttg 420 
ccaactacct tagtgatctc gcctttcacg tagtggacaa attcttccaa ctgatctgcg 480 
cgcgaggcca agcgatcttc ttcttgtcca agataagcct gtctagcttc aagtatgacg 540 
ggctgatact gggccggcag gcgctccatt gcccagtcgg cagcgacatc cttcggcgcg 600 
attttgccgg ttactgcgct gtaccaaatg cgggacaacg taagcactac atttcgctca 660 
tcgccagccc agtcgggcgg cgagttccat agcgttaagg tttcatttag cgcctcaaat 720 
agatcctgtt caggaaccgg atcaaagagt tcctccgccg ctggacctac caaggcaacg 780 
ctatgttctc ttgcttttgt cagcaagata gccagatcaa tgtcgatcgt ggctggctcg 840 
■ aagatacctg "caagaatgtc attgcgctgc cattctccaa attgcagttc gcgcttagct 900 • 
ggataacgcc acggaatgat gtcgtcgtgc acaacaatgg tgacttctac agcgcggaga 960 
atctcgctct ctccagggga agccgaagtt tccaaaaggt cgttgatcaa agctcgccgc 1020 
gttgtttcat caagccttac ggtcaccgta accagcaaat caatatcact gtgtggcttc 1080 
aggccgccat ccactgcgga gccgtacaaa tgtacggcca gcaacgtcgg ttcgagatgg 1140 
cgctcgatga cgccaactac ctctgatagt tgagttgata cttcggcgat aaccgcttca 1200 
cgagccatga gatcctccag atccatgtat cattatagat aattgaagag tgaatgtcaa 1260 
gtcgacctcg agggggggcc cggtacc 1287 

<210> 51 
<211> 45 
<212> DNA 

<213> Kunstliche Seguenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: 
oligonucleotide primer 

<400> 51 

cggatccgga ggcatcatga ctaagaaagt agcaatctat acacg ^ 

<210> 52 
<211> 22 
<212> DNA 

<213> Kunstliche Sequenz 
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<220> 

<223> Beschreibung der kunstlichen Sequenz: 
oligonucleotide primer 

<400> 52 

ataagcttta ttctcgatat eg 22 

<210> 53 
<211> 1S45 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: insertion of 

vector pCB557-l 
<400> 53 

ggtacctcca actegcttaa ttgcgagttt ttatttcgtt tatttcaatt aaggtaacta 60 
aaaaactcct tttaaggagt ttctgagatc aattctaege ccccaactga gagaactcaa 120 
aggttacccc agttggggca etaeggatea gagatgtaac tccagttcct teggaategg 180 
tagtcaatcc tatttccgat aggggcagtt gacaattgaa tccgattttg accattattt 240 
teatatcegt aatagtgcga aaagaaggee cggctccaag ttgttcaaga atagtggcgt 300 
tgagtttctc gaccctttga cttaggatta gtcagttcta tttctcgatg gggcggggaa 360 
gggatataac teageggtag agtgtcacct tgacgtggtg gaagtcatca gttcgagect 420 
gattatccct aagcccaatg tgagtttttc tagttggatt tttgacaatt ttcctctgaa 480 
ttatataatt aacataggat caattcatct cgaggaggtc acatgggagc ttggattgaa 540 
caagatggat tgeaegcagg ttctccggcc gcttgggtgg agaggctatt eggctatgae 600 
tgggcacaac agacaategg ctgetctgat gccgccgtgt tccggctgtc agegcagggg 660 
cgcccggttc tttttgtcaa gaccgacctg tccggtgccc tgaatgaact gcaggacgag 720 
gcagcgcggc tatcgtggct ggccacgacg ggcgttcctt gcgcagctgt getcgaegtt 780 
gtcactgaag egggaaggga ctggctgcta ttgggcgaag tgeeggggea ggatctcctg 840 
tcatctcacc ttgctcctgc cgagaaagta tccatcatgg ctgatgcaat gcggcggctg 900 
cataegcttg atccggctac ctgcccattc gaccaccaag cgaaacatcg catcgagega 960 
gcacgtactc ggatggaagc cggtcttgtc gatcaggatg atctggacga agagcatcag 1020 
gggctcgcgc cagccgaact gttcgecagg ctcaaggcgc gcatgcccga eggegaggat 1080 
ctcgtcgtga cccatggcga tgcctgcttg ccgaatatca tggtggaaaa tggccgcttt 1140 
tctggattca -tcgactgtgg ccggctgggt gtggcggacc gctatcagga catagegttg. 1200 
gctacccgtg atattgetga agagcttggc ggcgaatggg ctgaccgctt cctcgtgctt 1260 
taeggtateg ccgctcccga ttcgcagcgc atcgccttct atcgccttct tgacgagttc 1320 
ttctgatcta gaggaggtca catggcgctc accaatgctc aaatcttggc tgtgattgac 1380 
agttgggaag aaacagtegg tcagtttcca gtgataaege accatgtacc attaggtggc 1440 
ggtctgcaag gaacgctcca ttgttacgag atccccctag cagctcctta tggggttggc 1500 
tttgetaaga atgggcctac ccgctggcaa tacaaaegga caatcaatca agtcgtccac 1560 
agatgggggt cccacacagt cccttttcta ttagaacegg ataacatcaa cggcaaaacc 1620 
tgcacagcat cgcacctatg tcataatact cgatgccaca atcccttgca cttgtgctgg 1680 
gagtcactag acgacaacaa aggcagaaac tggtgccccg gtcccaacgg gggatgtgtc 1740 
catgcggtgg tttgtttaag gcagggtccg ttgtacggcc caggggegae tgtggcaggt 1800 
cctcaacaaa ggggcagtca ctttgtggta taaggtaccg agctc 1845 

<210> 54 
<211> 1965 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: insertion of 

vector pCB554-3 
<400> 54 

ggtaceggge cccccctcga ggtcgacttg acattcactc ttcaattatc tataatgata 60 
catggatccg gaggcatcat gacacaaggg gttgtgaccg gggtggacac gtacgcgggt 120 
gcttacgacc gtcagtcgcg egagegegag aattcgagcg cagcaagccc agegacacag 180 
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cgtagcgcca acgaagacaa ggcggccgac cttcagcgcg aagtcgagcg cgacgggggc 240 
cggttcaggt tcgtcgggca tttcagcgaa gcgccgggca cgtcggcgtt cgggacggcg 300 
gagcgcccgg agttcgaacg catcctgaac gaatgccgcg ccgggcggct caacatgatc 360 
attgtctatg acgtgtcgcg cttctcgcgc ctgaaggtca tggacgcgat tccgattgtc 420 
tcggaattgc tcgccctggg cgtgacgatt gtttccactc aggaaggcgt cttccggcag 480 
ggaaacgtca tggacctgat tcacctgatt atgcggctcg acgcgtcgca caaagaatct 540 
tcgctgaagt cggcgaagat tctcgacacg aagaaccttc agcgcgaatt gggcgggtac 600 
gtcggcggga aggcgcctta cggcttcgag cttgtttcgg agacgaagga gatcacgcgc 660 
aacggccgaa tggtcaatgt cgtcatcaac aagcttgcgc actcgaccac tccccttacc 720 
ggacccttcg agttcgagcc cgacgtaatc cggtggtggt ggcgtgagat caagacgcac 780 
aaacaccttc ccttcaagcc gggcagtcaa gccgccattc acccgggcag catcacgggg 840 
ctttgtaagc gcatggacgc tgacgccgtg ccgacccggg gcgagacgat tgggaagaag 900 
accgcttcaa gcgcctggga cccggcaacc gttatgcgaa tccttcggga cccgcgtatt 960 
gcgggcttcg ccgctgaggt gatctacaag aagaagccgg acggcacgcc gaccacgaag 1020 
attgagggtt accgcattca gcgcgacccg atcacgctcc ggccggtcga gcttgattgc 1080 
ggaccgatca tcgagcccgc tgagtggtat gagcttcagg cgtggttgga cggcaggggg 1140 
cgcggcaagg ggctttcccg ggggcaagcc attctgtccg ccatggacaa gctgtactgc 1200 
gagtgtggcg ccgtcatgac ttcgaagcgc ggggaagaat cgatcaagga-ctcttaccgc 1260 
tgccgtcgcc ggaaggtggt cgacccgtcc gcacctgggc agcacgaagg cacgtgcaac 1320 
gtcagcatgg cggcactcga caagttcgtt gcggaacgca tcttcaacaa gatcaggcac 1380 
gccgaaggcg acgaagagac gttggcgctt ctgtgggaag ccgcccgacg cttcggcaag 1440 
ctcactgagg cgcctgagaa gagcggcgaa cgggcgaacc ttgttgcgga gcgcgccgac 1500 
gccctgaacg cccttgaaga gctgtacgaa gaccgcgcgg caggcgcgta cgacggaccc 1560 
gttggcagga agcacttccg gaagcaacag gcagcgctga cgctccggca gcaaggggcg 1620 
gaagagcggc ttgccgaact tgaagccgcc gaagccccga agcttcccct tgaccaatgg 1680 
ttccccgaag acgccgacgc tgacccgacc ggccctaagt cgtggtgggg gcgcgcgtca 1740 
gtagacgaca agcgcgtgtt cgtcgggctc ttcgtagaca agatcgttgt cacgaagtcg 1800 
actacgggca gggggcaggg aacgcccatc gagaagcgcg cttcgatcac gtgggcgaag 1860 
ccgccgaccg acgacgacga agacgacgcc caggacggca cggaagacgt agcggcgtag 1920 
ctgcagctcg agatctctag agcggccgcc accgcggtgg agctc 1965 
<210> 55 
<211> 42 
<212> DNA 

. <213>. Kunstliche Seguenz 
<220> 

<223> Beschreibung der kunstlichen Seguenz: 

oligonucleotide primer 
<400> 55 

tcgacttgac attcactctt caattatcta taatgataca tg 42 
<210> 56 
<211> 26 
<212> DNA 

<213> Kunstliche Seguenz 
<220> 

<223> Beschreibung der kunstlichen Seguenz: 

oligonucleotide primer 
<400> 56 

cctcgagctg cagttaagcg agttgg 26 
<210> 57 
<211> 1527 
<212> DNA 

<213> Kunstliche Seguenz 
<220> 

<223> Beschreibung der kunstlichen Seguenz: PCR produkt 
TP-Rek 
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<400> 57 

tcgacttgac attcactctt 
ctaagaaagt agcaatctat 
caattgatga gcaaattgac 
ctgatactta tactgatgct 
gattaatcaa cgatatcgag 
gcctttcacg tagtgtaaga 
aaatagactt tatctcgctt 
ttctcactat tctttctgca 
ctatgggtaa actagggcga 
ttgggtatta ccacaacaga 
tagttgaaca aatattcact 
aactcaatga atctgggcac 
aaacacttga taatccagtt 
gtatgcacaa accaattatc 
aaagacaaca gcagacttat 
tgctgtcagg gatggcaagg 
acaaaagaaa agatggaagc 
aaacaaaagg aattacagta 
taagtaattt agaaaatact 
ccttattgaa aattatcaat 
agcaaatttc acagatcgat 
ttatcactat ggatgagttg 
ttaaagctaa gattagcgaa 
aaactcagtt gggctcaatt 
tcaacaacct tgtatcaaag 
tccaactcgc ttaactgcag 

<210> 58 
<211> 1213 
<212> DNA 
<213> Kiinstliche Seguenz 

<220> 

<223> Beschreibung der ktinstlichen Sequenz: probe for 
southern blot 

<400> 58 

ttatcaccgg cagtctgttc agggttccaa actcaacgat ggcaactaaa cacgagggtt 60 
gcgctcgttg cgggacttaa cccaacacct tacggcacga gctgacgaca gccatgcacc 120 
acctgtgtcc gcgttcccga aggcacccct ctctttcaag aggattcgcg gcatgtcaag 180 
ccctggtaag gttcttcgct ttgcatcgaa ttaaaccaca tgctccaccg cttgtgcggg 240 
cccccgtcaa ttccttttag tttcattctt gcgaacgtac tccccaggcg ggatacttaa 300 
cgcgttagct acagcactgc acgggtcgat acgcacagcg cctagtatcc atcgtttacg 360 
gctaggacta ctggggtatc taatcccatt cgctccccta gctttcgtct ctcagtgtca 420 
gtgtcggccc agcagagtgc tttcgccgtt ggtgttcttt ccgatctcta cgcatttcac 480 
cgctccaccg gaaattccct ctgcccctac cgtactccag cttggtagtt tccaccgcct 540 
gtccagggtt gagccctggg atttgacggc ggacttaaaa agccacctac agacgcttta 600 
cgcccaatca ttccggataa cgcttgcatc ctctgtatta ccgcggctgc tggcacagag 660 
ttagccgatg cttattcccc agataccgtc attgcttctt ctccgggaaa agaagttcac 720 
gacccgtggg ccttctacct ccacgcggca ttgctccgtc aggctttcgc ccattgcgga 780 
aaattcccca ctgctgcctc ccgtaggagt ctgggccgtg tctcagtccc agtgtggctg 840 
atcatcctct cggaccagct actgatcatc gccttggtaa gctattgcct caccaactag 900 
ctaatcagac gcgagcccct cctcgggcgg attcctcctt ttgctcctca gcctacgggg 960 
tattagcagc cgtttccagc tgttgttccc ctcccaaggg caggttctta cgcgttactc 1020 
acccgtccgc cactggaaac accacttccc gtccgacttg catgtgttaa gcatgccgcc 1080 
agcgttcatc ctgagccagg atcgaactct ccatgagatt catagttgca ttacttatag 1140 
cttccttgtt cgtagacaaa gcggattcgg aattgtcttt cattccaagg cataacttgt 1200 
atccatgcgc ttc 12 13 



caattatcta taatgataca 
acacgagtat ccactactaa 
cgtttaacaa aatatgctga 
ggtttttcag gggccaaact 
aataaagctt ttgatacagt 
gatactcttt atcttgttaa 
aatgaaagta ttgatacttc 
attaatgagt ttgaaagaga 
gcgaaatctg gtaagtctat 
aagacaggta tattagaaat 
gattatttat caggaatatc 
atcggtaaag atataccgtg 
tactgtggtt atatcaaatt 
ccttatgaga cttatttaaa 
gaaagaaata acaaccctag 
tgcggttact gtggagcacc 
cgcactatga aatatcactg 
tataatgaca ataaaaagtg 
gttattgaca acctgattgg 
ggcaacaacc aacctattct 
aaaaaaatac aaaagaactc 
aaagatcgta ctgattccct 
aataaattta atgactctac 
ccgattaatg aactatcata 
gttgatgtta ctgctgataa 
ctcgagg 



tggatccgga ggcatcatga 60 
ccaagcagag gaagggttct 120 
agcaatgggg tggcaagtat 180 
tgaacgccca gcaatgcaaa 240 
tcttgtatat aagctagacc 300 
ggatgtgttc acaaaaaata 3 60 
ttctgctatg ggtagcttgt 420 
gaatataaaa gaacgcatga 480 
gatgtggact aagacagctt 540 
tgttccttta caagctacaa 600 
acttacaaaa ttaagagata 660 
gtcttatcgt accctaagac 720 
taaggacagc ctatttgaag 780 
agttcaaaaa gagctagaag 840 
acctttccaa gctaaatata 900 
tttaaaaatt gttcttggcc 960 
tgcaaataga tttcctcgaa 1020 
tgattcagga acttatgatt 1080 
atttcaagaa aataatgact 1140 
tgatacttcg tcatttaaaa 1200 
tgatttgtac ctaaatgatt 1260 
tcaggctgag aaaaagctgc 1320 
tgatgttttt gagttagtta 1380 
tgataataaa aagaaaatcg 1440 
tgtagatatc atatttaaat 1500 
1527 
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<210> 59 
<211> 34 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kiinstlichen Sequenz: : promoter 
sequence derived from consensus sequence of 
E.coli sigma70 promoters 

<400> 59 

ttgacaattt tcctctgaat tatataatta acat 
<210> 60 
<211> 1564 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kiinstlichen Sequenz: Insertion of 

• • " 'vector pCB487-20 

<220> 

<221> misc_feature 

<222> (28).. (32) 

<223> ribosome binding site 

<220> 

<221> CDS 

<222> (37).. (1491) 

<223> coding for TP901 rekombinase 

<400> 60 

gcggccgcga attcgccctt cggatccgga ggcatc atg act aag aaa gta gca 

Met Thr Lys Lys Val Ala 
1 5 
ate tat aca cga gta tec act act aac caa gca gag gaa ggg ttc tea 
lie Tyr Thr Arg Val Ser Thr Thr Asn Gin Ala Glu Glu Gly Phe Ser 

10 15 20 

att gat gag caa att gac cgt tta aca aaa tat get gaa gca atg ggg 
lie Asp Glu Gin lie Asp Arg Leu Thr Lys Tyr Ala Glu Ala Met Gly 

25 30 35 

tgg caa gta tct gat act tat act gat get ggt ttt tea ggg gec aaa 
Trp Gin Val Ser Asp Thr Tyr Thr Asp Ala Gly Phe Ser Gly Ala Lys 

40 45 50 

ctt gaa cgc cca gca atg caa aga tta ate aac gat ate gag aat aaa 
Leu Glu Arg Pro Ala Met Gin Arg Leu He Asn Asp He Glu Asn Lys 
55 60 65 70 

get ttt gat aca gtt ctt gta tat aag eta gac cgc ctt tea cgt agt 
Ala Phe Asp Thr Val Leu Val Tyr Lys Leu Asp Arg Leu Ser Arg Ser 

75 80 85 

gta aga gat act ctt tat ctt gtt aag gat gtg ttc aca aaa aat aaa 
Val Arg Asp Thr Leu Tyr Leu Val Lys Asp Val Phe Thr Lys Asn Lys 

90 95 100 

ata gac ttt ate teg ctt aat gaa agt att gat act tct tct get atg 
He Asp Phe He Ser Leu Asn Glu Ser He Asp Thr Ser Ser Ala Met 

105 110 115 

ggt age ttg ttt etc act att ctt tct gca att aat gag ttt gaa aga 
Gly Ser Leu Phe Leu Thr He Leu Ser Ala He Asn Glu Phe Glu Arg 
120 125 130 
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gag aat ata aaa gaa cgc atg act atg ggt aaa eta ggg cga gcg aaa 486 
Glu Asn lie Lys Glu Arg Met Thr Met Gly Lys Leu Gly Arg Ala Lys 
135 140 145 150 

tct ggt aag tct atg atg tgg act aag aca get ttt ggg tat tac cac 534 
Ser Gly Lys Ser Met Met Trp Thr Lys Thr Ala Phe Gly Tyr Tyr His 

155 160 165 

aac aga aag aca ggt ata tta gaa att gtt cct tta caa get aca ata 582 
Asn Arg Lys Thr Gly lie Leu Glu lie Val Pro Leu Gin Ala Thr He 

170 175 180 

gtt gaa caa ata ttc act gat tat tta tea gga ata tea ctt aca aaa 630 
Val Glu Gin He Phe Thr Asp Tyr Leu Ser Gly He Ser Leu Thr Lys 

185 190 195 

tta aga gat aaa etc aat gaa tct ggg cac ate ggt aaa gat ata ccg 678 
Leu Arg Asp Lys Leu Asn Glu Ser Gly His He Gly Lys Asp He Pro 

200 205 210 

tgg tct tat cgt acc eta aga caa aca ctt gat aat cca-gtt tac tgt... 726 
Trp Ser Tyr Arg Thr Leu Arg Gin Thr Leu Asp Asn Pro Val Tyr Cys 
215 220 225 230 

ggt tat ate aaa ttt aag gac age eta ttt gaa ggt atg cac aaa cca 774 
Gly Tyr He Lys Phe Lys Asp Ser Leu Phe Glu Gly Met His Lys Pro 

235 240 245 

att ate cct tat gag act tat tta aaa gtt caa aaa gag eta gaa gaa 822 
He He Pro Tyr Glu Thr Tyr Leu Lys Val Gin Lys Glu Leu Glu Glu 

250 255 260 

aga caa cag cag act tat gaa aga aat aac aac cct aga cct ttc caa 870 
Arg Gin Gin Gin Thr Tyr Glu Arg Asn Asn Asn Pro Arg Pro Phe Gin 

265 270 275 



get aaa tat atg ctg tea 
Ala Lys Tyr Met Leu Ser 
280 

cct tta aaa att gtt ctt 
Pro Leu Lys He Val Leu 
295 300 



ggg atg gca agg tgc ggt 
Gly Met Ala Arg Cys Gly 
285 290 
ggc cac aaa aga aaa gat 
Gly His Lys Arg Lys Asp 
305 



tac tgt gga gca 918 
Tyr Cys Gly Ala 



gga age cgc act 966 
Gly Ser Arg Thr 
310 



atg aaa tat cac tgt gca aat aga ttt cct cga aaa aca aaa gga att 1014 
Met Lys Tyr His Cys Ala Asn Arg Phe Pro Arg Lys Thr Lys Gly He 

315 320 325 

aca gta tat aat gac aat aaa aag tgt gat tea gga act tat gat tta 1062 
Thr Val Tyr Asn Asp Asn Lys Lys Cys Asp Ser Gly Thr Tyr Asp Leu 

330 335 340 

agt aat tta gaa aat act gtt att gac aac ctg att gga ttt caa gaa 1110 
Ser Asn Leu Glu Asn Thr Val He Asp Asn Leu He Gly Phe Gin Glu 

345 350 355 

aat aat gac tec tta ttg aaa att ate aat ggc aac aac caa cct att 1158 
Asn Asn Asp Ser Leu Leu Lys He He Asn Gly Asn Asn Gin Pro He 

360 365 370 

ctt gat act teg tea ttt aaa aag caa att tea cag ate gat aaa aaa 1206 
Leu Asp Thr Ser Ser Phe Lys Lys Gin He Ser Gin He Asp Lys Lys 
375 " 380 385 390 

ata caa aag aac tct gat ttg tac eta aat gat ttt ate act atg gat 1254 
He Gin Lys Asn Ser Asp Leu Tyr Leu Asn Asp Phe He Thr Met Asp 
395 " 400 405 
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gag ttg aaa gat cgt act gat tec ctt cag get gag aaa aag ctg ctt 1302 
Glu Leu Lys Asp Arg Thr Asp Ser Leu Gin Ala Glu Lys Lys Leu Leu 

410 415 420 

aaa get aag att age gaa aat aaa ttt aat gac tct act gat gtt ttt 1350 
Lys Ala Lys lie Ser Glu Asn Lys Phe Asn Asp Ser Thr Asp val Phe 

425 430 435 

gag tta gtt aaa act cag ttg ggc tea att ccg att aat gaa eta tea 1398 
Glu Leu Val Lys Thr Gin Leu Gly Ser He Pro He Asn Glu Leu Ser 

440 445 450 

tat gat aat aaa aag aaa ate gtc aac aac ctt gta tea aag gtt gat 1446 
Tyr Asp Asn Lys Lys Lys He Val Asn Asn Leu Val Ser Lys Val Asp 
455 460 465 470 

gtt act get gat aat gta gat ate ata ttt aaa ttc caa etc get 1491 
val Thr Ala Asp Asn Val Asp He He Phe Lys Phe Gin Leu Ala 
475 480 485 

- taactgeage tcgaggaagg gcgaattctg cagatatcca tcacactggc ggccgctcga 1551 
geatgeatet agt 1564 
<210> 61 
<211> 485 
<212> PRT 

<213> Kunstliche Sequenz 

<223> Beschreibung der kunstlichen Sequenz: Insertion of 

vector pCB487-20 
<400> 61 

Met Thr Lys Lys Val Ala He Tyr Thr Arg Val Ser Thr Thr Asn Gin 

15 10 15 

Ala Glu Glu Gly Phe Ser He Asp Glu Gin He Asp Arg Leu Thr Lys 

20 25 30 

Tyr Ala Glu Ala Met Gly Trp Gin Val Ser Asp Thr Tyr Thr Asp Ala 

35 40 45 

Gly Phe Ser Gly Ala Lys Leu Glu Arg Pro Ala Met Gin Arg Leu He 

50 55 60 

Asn Asp He Glu Asn Lys Ala Phe Asp Thr Val Leu Val Tyr Lys Leu 
65 " 70 75 80 

Asp Arg Leu Ser Arg Ser Val Arg Asp Thr Leu Tyr Leu Val Lys Asp 

85 90 95 

Val Phe Thr Lys Asn Lys He Asp Phe He Ser Leu Asn Glu Ser He 

100 105 110 

Asp Thr Ser Ser Ala Met Gly Ser Leu Phe Leu Thr He Leu Ser Ala 

115 120 125 

He Asn Glu Phe Glu Arg Glu Asn He Lys Glu Arg Met Thr Met Gly 

130 135 140 

Lys Leu Gly Arg Ala Lys Ser Gly Lys Ser Met Met Trp Thr Lys Thr 
145 150 155 160 

Ala Phe Gly Tyr Tyr His Asn Arg Lys Thr Gly He Leu Glu He Val 

165 170 175 

Pro Leu Gin Ala Thr He Val Glu Gin He Phe Thr Asp Tyr Leu Ser 

180 185 190 

Gly He Ser Leu Thr Lys Leu Arg Asp Lys Leu Asn Glu Ser Gly His 
195 200 205 
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He Gly Lys Asp He Pro Trp Ser Tyr Arg Thr Leu Arg Gin Thr Leu 

210 215 220 

Asp Asn Pro Val Tyr Cys Gly Tyr He Lys Phe Lys Asp Ser Leu Phe 
225 230 235 240 

Glu Gly Met His Lys Pro He He Pro Tyr Glu Thr Tyr Leu Lys Val 

245 250 255 

Gin Lys Glu Leu Glu Glu Arg Gin Gin Gin Thr Tyr Glu Arg Asn Asn 

260 265 270 

Asn Pro Arg Pro Phe Gin Ala Lys Tyr Met Leu Ser Gly Met Ala Arg 

275 280 285 

Cys Gly Tyr Cys Gly Ala Pro Leu Lys He Val Leu Gly His Lys Arg 

290 295 300 

Lys Asp Gly Ser Arg Thr Met Lys Tyr His Cys Ala Asn Arg Phe Pro 
305 310 315 320 

• Arg Lys Thr Lys Gly- He Thr Val Tyr Asn Asp Asn Lys Lys Cys-Asp- 
325 330 335 

Ser Gly Thr Tyr Asp Leu Ser Asn Leu Glu Asn Thr Val He Asp Asn 

340 " 345 350 

Leu He Gly Phe Gin Glu Asn Asn Asp Ser Leu Leu Lys He He Asn 

355 360 365 

Gly Asn Asn Gin Pro He Leu Asp Thr Ser Ser Phe Lys Lys Gin He 

370 375 380 

Ser Gin He Asp Lys Lys He Gin Lys Asn Ser Asp Leu Tyr Leu Asn 
385 390 395 400 

Asp Phe He Thr Met Asp Glu Leu Lys Asp Arg Thr Asp Ser Leu Gin 

405 410 415 

Ala Glu Lys Lys Leu Leu Lys Ala Lys He Ser Glu Asn Lys Phe Asn 

420 425 430 

Asp Ser Thr Asp Val Phe Glu Leu Val Lys Thr Gin Leu Gly Ser He 
435 440 445 

Pro He Asn Glu Leu Ser Tyr Asp Asn Lys Lys Lys He Val Asn Asn 

450 455 460 

Leu Val Ser Lys Val Asp Val Thr Ala Asp Asn Val Asp He He Phe 
465 470 475 480 

Lys Phe Gin Leu Ala 
485 
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